9 бесплатных онлайн-курсов по Big Data

В ближайшие два года количество занятых специалистов Big Data во всем мире вырастет на 28%, прогнозирует IBM. Эта профессия станет одной из самых востребованных на рынке.

Студенты штурмуют открывшиеся в престижных университетах курсы по большим данным. А что делать тем из нас, кто не хочет остаться без работы в ближайшем будущем или готов попробовать себя в перспективной отрасли?

Памятуя поговорку о том, что учиться никогда не поздно, публикуем подборку бесплатных онлайн-курсов, на которых можно уже сегодня получить базовые знания и практические навыки в модной нынче специальности data scientist.

Подборка составлена англоязычным Forbes. Все курсы на английском языке.

Coursera Data Science Specialization

Coursera предлагает один из самых основательных и, главное, бесплатных курсов по науке о данных. Партнером курса выступает Университет Джона Хопкинса (Балтимор, Мэриленд).

Курс состоит из 10 блоков, которые охватывают статистическое программирование на R, кластерный анализ, обработку естественного языка и практическое применение машинного обучения. В завершение курса студентам предлагается создать свой продукт на основе данных для решения реальной проблемы.

Coursera – Data-Driven Decision Making

Еще один курс от Coursera, на этот раз созданный в партнерстве с фирмой PwC. Неудивительно, что он заточен под решение практических задач в сфере бизнеса. Теоретической же подготовке уделяется меньше времени.

Студенты здесь осваивают инструменты и техники, которые применяются в бизнесе для решения задач, связанных с большими данными. Курс, рассчитанный на 4 недели, завершается самостоятельным заданием, в ходе которого студент должен создать решение Big Data в симуляции бизнес-среды.

EdX – Data Science Essentials

Этот курс создан Microsoft и является частью общей программы сертификации Professional Program Certificate в сфере Data Science. Однако курс можно пройти и отдельно от сертификата.

Студенты должны обладать первоначальными знаниями в языках программирования R или Python. (На сегодня это самые распространенные языки программирования в сфере больших данных). Темы курса охватывают теорию вероятностей и статистику, сбор данных и визуализацию, введение в машинное обучение, использование платформы Microsoft Azure.

Все материалы курса бесплатны. Но за $90 можно получить официальный сертификат о прохождении обучения.

Udacity – Intro to Machine Learning

Машинное обучение – одно из самых «горячих» направлений в науке о данных. Этот курс дает общее представление об отрасли – от теории до практического применения. Он является частью платной программы Udacity, по прохождении которой можно также получить «степень».

IBM – Data Science Fundamentals

Компания IBM предлагает целую серию из онлайн-курсов на специально созданном сайте, некогда известном как Big Data University и теперь переименованном в Cognitive Class. Программы охватывают введение, методологию, создание практических приложений, программирование на R и инструменты open source.

Курс рассчитан примерно на 20 часов. Студенты, имеющие базовые знания, могут пройти его быстрее.

California Institute of Technology – Learning from Data

Калифорнийский технологический институт разработал онлайн-курс по машинному обучению. Он включает серию видео-лекций, домашние задания и экзаменационное задание. Студенты должны обладать первоначальными познаниями в математике, разбираться матрицах и матричном исчислении.

Dataquest – Become a Data Scientist

Dataquest – независимый провайдер образовательного контента. Площадка не аффилирована с университетами или компаниями, в отличие от других перечисленных здесь курсов.

Доступ к большинству учебных материалов бесплатный. Однако есть возможность платной подписки и прохождения курсов с наставником.

Курс состоит из трех частей для трех компетенций – дата-аналитик, дата-исследователь и дата-инженер. Программа получила положительные отклики от представителей компаний Uber, Amazon и Spotify.

KDNuggets – Data Mining Course

Сайт KDNuggets, посвященный бизнесу и науке о данных, составил собственный учебный курс. Он включает модули по машинному обучению, статистическим концепциям (дерево решений, регрессия, кластеризация и классификация) и введение в практику.

The Open Source Data Science Masters

Этот курс полностью состоит из открытых источников и бесплатных материалов. Он включает машинное обучение, обработку естественного языка на основе Twitter API, а также систему Hadoop MapReduce, базы данных SQL и noSQL, основы визуализации.

Программа не предусматривает никакой сертификации. Ее преимущество в том, что можно заниматься по своему графику и сообразно своим возможностям.