В ближайшие два года количество занятых специалистов Big Data во всем мире вырастет на 28%, прогнозирует IBM. Эта профессия станет одной из самых востребованных на рынке.
Студенты штурмуют открывшиеся в престижных университетах курсы по большим данным. А что делать тем из нас, кто не хочет остаться без работы в ближайшем будущем или готов попробовать себя в перспективной отрасли?
Памятуя поговорку о том, что учиться никогда не поздно, публикуем подборку бесплатных онлайн-курсов, на которых можно уже сегодня получить базовые знания и практические навыки в модной нынче специальности data scientist.
Подборка составлена англоязычным Forbes. Все курсы на английском языке.
Coursera – Data Science Specialization
Coursera предлагает один из самых основательных и, главное, бесплатных курсов по науке о данных. Партнером курса выступает Университет Джона Хопкинса (Балтимор, Мэриленд).
Курс состоит из 10 блоков, которые охватывают статистическое программирование на R, кластерный анализ, обработку естественного языка и практическое применение машинного обучения. В завершение курса студентам предлагается создать свой продукт на основе данных для решения реальной проблемы.
Coursera – Data-Driven Decision Making
Еще один курс от Coursera, на этот раз созданный в партнерстве с фирмой PwC. Неудивительно, что он заточен под решение практических задач в сфере бизнеса. Теоретической же подготовке уделяется меньше времени.
Студенты здесь осваивают инструменты и техники, которые применяются в бизнесе для решения задач, связанных с большими данными. Курс, рассчитанный на 4 недели, завершается самостоятельным заданием, в ходе которого студент должен создать решение Big Data в симуляции бизнес-среды.
EdX – Data Science Essentials
Этот курс создан Microsoft и является частью общей программы сертификации Professional Program Certificate в сфере Data Science. Однако курс можно пройти и отдельно от сертификата.
Студенты должны обладать первоначальными знаниями в языках программирования R или Python. (На сегодня это самые распространенные языки программирования в сфере больших данных). Темы курса охватывают теорию вероятностей и статистику, сбор данных и визуализацию, введение в машинное обучение, использование платформы Microsoft Azure.
Все материалы курса бесплатны. Но за $90 можно получить официальный сертификат о прохождении обучения.
Udacity – Intro to Machine Learning
Машинное обучение – одно из самых «горячих» направлений в науке о данных. Этот курс дает общее представление об отрасли – от теории до практического применения. Он является частью платной программы Udacity, по прохождении которой можно также получить «степень».
IBM – Data Science Fundamentals
Компания IBM предлагает целую серию из онлайн-курсов на специально созданном сайте, некогда известном как Big Data University и теперь переименованном в Cognitive Class. Программы охватывают введение, методологию, создание практических приложений, программирование на R и инструменты open source.
Курс рассчитан примерно на 20 часов. Студенты, имеющие базовые знания, могут пройти его быстрее.
California Institute of Technology – Learning from Data
Калифорнийский технологический институт разработал онлайн-курс по машинному обучению. Он включает серию видео-лекций, домашние задания и экзаменационное задание. Студенты должны обладать первоначальными познаниями в математике, разбираться матрицах и матричном исчислении.
Dataquest – Become a Data Scientist
Dataquest – независимый провайдер образовательного контента. Площадка не аффилирована с университетами или компаниями, в отличие от других перечисленных здесь курсов.
Доступ к большинству учебных материалов бесплатный. Однако есть возможность платной подписки и прохождения курсов с наставником.
Курс состоит из трех частей для трех компетенций – дата-аналитик, дата-исследователь и дата-инженер. Программа получила положительные отклики от представителей компаний Uber, Amazon и Spotify.
KDNuggets – Data Mining Course
Сайт KDNuggets, посвященный бизнесу и науке о данных, составил собственный учебный курс. Он включает модули по машинному обучению, статистическим концепциям (дерево решений, регрессия, кластеризация и классификация) и введение в практику.
The Open Source Data Science Masters
Этот курс полностью состоит из открытых источников и бесплатных материалов. Он включает машинное обучение, обработку естественного языка на основе Twitter API, а также систему Hadoop MapReduce, базы данных SQL и noSQL, основы визуализации.
Программа не предусматривает никакой сертификации. Ее преимущество в том, что можно заниматься по своему графику и сообразно своим возможностям.