data analyst обучение с нуля

Аналитик данных с нуля

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Научитесь анализировать данные с помощью сервисов аналитики и BI-инструментов, освоите Python и SQL. Сможете строить прогнозы на основе данных и помогать бизнесу принимать решения.

Получите профессию в перспективной сфере

ищут аналитиков. Среди них: Яндекс, Ozon, Сбер, ВТБ

зарплата специалиста с опытом работы 1–3 года

Кому подойдёт этот курс

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Студенты технических вузов

Узнаете, как проводить исследования, анализировать данные и делать наглядные отчёты. В короткие сроки получите специализацию и сможете начать карьеру в аналитике на позиции Junior.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Руководители и владельцы бизнеса

Взглянете по-новому на свой продукт, изучите его сильные и слабые стороны. Узнаете, как делать прогнозы для бизнеса, развивать продукт и решать текущие проблемы на основе данных аналитики.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Разработчики, которые хотят сменить профиль

Поймёте, как применить свои знания в программировании для решения бизнес-задач. Изучите инструменты для анализа, сборки и презентации данных заказчику — и станете более востребованным специалистом.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Бизнес-аналитикам

Подтянете знания аналитики, изучите основы программирования на Python. Сможете работать с базами данных и Power BI, создавать эффектные презентации. Расширите компетенции и станете лучше решать текущие задачи.

Получить полную программу курса и консультацию

Похоже произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Ваша заявка успешно отправлена

Учитесь сейчас, платите потом!

Расходы за первые 3 месяца обучения берет на себя Skillbox. В это время вы смотрите видеоматериалы, практикуетесь на реальных задачах, прокачиваете навыки и начинаете зарабатывать.

Кредитная программа от надёжных банков

Чему вы научитесь

Проводить исследования и делать точные выводы

Изучите математическую основу анализа, научитесь работать с массивами данных и находить закономерности в цифрах.

Использовать программирование в аналитике

Освоите основы программирования на Python для решения базовых бизнес-задач. Научитесь собирать базы данных на языке SQL и управлять ими.

Строить гипотезы и оценивать перспективы бизнес-решений

Узнаете, какие метрики эффективности использует бизнес. Поймёте, как их собирать, читать, строить прогнозы и находить рабочие идеи.

Работать с сервисами аналитики и дашбордами

Научитесь работать с Яндекс.Метрикой и Google Analytics и собирать данные в одно окно для быстрого доступа к отчёту.

Делать развёрнутые аналитические отчёты

Поймёте, как пользоваться инструментами для визуализации данных, таблицами Google и Excel — и формировать отчёты для клиентов.

Работать с заказчиками аналитики

Научитесь обрабатывать различные типы аналитических запросов от бизнеса и презентовать результаты своей работы убедительно и понятно для коллег.

О Skillbox

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Как пользоваться платформой

Изучаете тему

В курсе — практические видеоуроки.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Выполняете задания

В том темпе, в котором вам удобно.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Работаете с преподавателем

Закрепляете знания и исправляете ошибки.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Защищаете дипломную работу

И дополняете ею своё портфолио.

data analyst обучение с нуля. Смотреть фото data analyst обучение с нуля. Смотреть картинку data analyst обучение с нуля. Картинка про data analyst обучение с нуля. Фото data analyst обучение с нуля

Программа

Вас ждут онлайн-лекции и практические задания с разным уровнем сложности. Этих знаний хватит, чтобы устроиться в компанию на junior-позицию.

Источник

Изучение data science c нуля: этапы и вехи

В соответствии с концепцией спирального подхода к обучению, о которой писал ранее, привожу поэтапный план освоения data science. План составлен так, чтобы каждый этап делал учащегося в той или иной степени лучше подготовленным к выполнению реальных задач. Такой подход вдохновлен идеологией Agile в том смысле, что сколько бы времени вы ни уделили обучению и в какой бы момент ни остановились, у вас будет наиболее востребованный набор знаний из возможных к освоению за такое время.

Объяснить данную логику также можно от обратного: опасно сразу учить нейронные сети, т.к. не востребован человек знающих о них что-то, но не умеющий эффективно применять на практике. И, например, можно за 300 ч получить какой-то набор знаний, который не делает вас достаточно хорошим специалистом для решения каких-либо реальных задач, и не позволит найти даже начальную работу чтобы продолжить развивать эти навыки.

Позднее, в отдельной статье напишу хорошие курсы и книги, соответствующие каждому этапу (некоторые курсы и книги для первых этапов уже указал ранее в первой статье этой серии).

Этап 1. Базовые инструменты анализа данных: SQL, Excel

SQL, основы (20ч). Самостоятельное знание SQL может пригодится для выполнения кучи других задачи. И оно, в любом случае, необходимо для большой (большей?) части вакансий на позицию аналитика, дата сайентиста и, тем более, machine learning engineer.

Основы Excel (10ч): фильтры и сортировка данных, формулы, vlookup, pivot tables, базовая работа с графиками. Коллеги, партнеры или руководство будут присылать входящие данные в excel, и вам нужно будет уметь их быстро понять и изучить. Нередко и результаты анализа сделанного на Питоне удобнее подготовить и предоставить в Excel.

Базовый английский (20-200ч, зависит от предыдущего уровня), на уровне самостоятельного чтения технической документации и спец.литературы. Например, вам совершенно необходимо уметь читать официальную документацию pandas/scikit, и также многие хорошие материалы по Python доступны только на английском.

Этап 2. Основы Python и Pandas

Основы Python (80ч). Без знания Питона невозможно использовать львиную часть инструментов машинного обучения. Другие языки менее эффективны в этой сфере и непопулярны.

Также научиться основам работы с разными API и парсингом данных (requests, beatiful soup)

На этом этапе дополнительные знания Python позволяют вытаскивать данные из разных API, или путем веб-парсинга.

Возможно, на работе в позиции аналитика от вас не будут ожидать знаний Питона. Но вы можете сами найти где его применить, автоматизировать что-либо, и получить большой плюс в глазах работодателя (помимо ценного опыта для себя). Шансы на трудоустройство на этом этапе не вырастут, но может вырасти зарплата, если эффективно это будете применять.

Этап 3. Базовые понятия и классические алгоритмы машинного обучения

(Этот этап может занять 200-400 ч в зависимости от того, насколько хорошо изначально вы владеете математикой)

Базовые понятия машинного обучения:

Экстраполяции (понимание возможности в контексте разных алгоритмов)

Базовые алгоритмы, которые достаточно знать на уровне главных принципов:

Прогнозирование и классификация:

Работа с временными рядами: экспоненциальное сглаживание

Понижение размерности: PCA

Базовые приёмы подготовки данных: dummy переменные, one-hot encoding, tf-idf

умение считать вероятности: основы комбинаторики, вероятности независимых событий и условные вероятности (формула Байеса).

Понимать смысл фразы: «correlation does not imply causation», чтобы верно трактовать результаты моделей.

Мат.методы, необходимые для полного понимания, как работают ключевые модели машинного обучения: Градиентный спуск. Максимальное правдоподобие (max likelihood), понимание зачем на практике используются логарифмы (log-likelihood). Понимание как строиться целевая функция логистической регрессии (зачем log в log-odds), понимание сути логистической функции (часто называемой «сигмоид»). С одной стороны, нет жесткой необходимости всё это понять на данном этапе, т.к все алгоритмы можно использовать как черные ящики, зная только основные принципы. Но понимание математики поможет глубже понять разные модели и придать уверенности в их использовании. Позднее, для уровня senior, эти знания являются уже обязательным:

Без практических навыков знания данного этапа мало повышают ваши шансы на трудоустройство. Но значительно облегчают общение с другими дата-сайентистами и открывают путь для понимания многих дальнейших источников (книг/курсов) и позволяют начать практиковаться в их использовании.

Этап 4. Набор базовых навыков решения задач

По сути, это практика по теоретическим знания предыдущего этапа. Имеет смысл отвести на это 100-300ч. И важнее уметь хотя бы как-то применять все указанные выше методы, чем дотошно разобраться в одном из них.

Тут же следует инвестировать время в изучение разных приёмов и трюков feature engineering

По завершению данного этапа есть шанс устроиться на позицию junior data scientist. ЗП будет низкая. Но главное будет продолжать учиться. До достижения уровня senior возможность учиться у коллег ценнее, чем текущая зарплата.

Знакомство с основами нейронных сетей

На данном этапе может быть полезно знание основ нейронных сетей, CNN, RNN/LSTM слоев, vector embeddings. Но не обязательно уметь тренировать их самому, на данном этапе. Пока это важно для «общего развития» и чтобы вы не хотели применять нейронные сети там, где без можно обойтись, и, наоборот, понимали где они могут быть полезны и когда имеет смысл или обращаться к коллеге уже их знающему, или браться за глубокое изучение и практику.

Также данный этап должен позволить примерно оченить сколько ресурсов от вас это потребует, если вы решите в это нырнуть.

Рекомендую ограничить это объемом в 20-40ч, необходимым только для общего понимания концепций.

Этап 5. Дополнительные технические навыки, необходимые в работе

Данные этап может занять 60-200ч, в зависимости от степени перфекционизма. Оптимальным кажется изучить всё на столько, чтобы понимать ключевые принципы и команды, но не обязательно тренироваться на большом количестве учебных примерах, т.к. если удастся устроиться на работу, то получение практики и оттачивание навыков можно делать уже в процессе работы

Conda, понимание проблем зависимостей версий библиотек, и как conda это может решить

Python standard library, если не освоили ранее (необходимый минимум itertools, collections, contextlib), умение эффективно разбивать код на функции и модули, классы; умение применять context managers.

Основы git, также очень полезно умение работать с IDE: pycharm/vs code. Их использование облегчит работу с git, заменив графическим интерфейсом работу с командной строкой

Библиотеки визуализации (matplotlib+seaborn, plotnine, plotly), если не освоили их раньше.

С таким багажом знаний наверняка можно найти позицию джуниор дата сайентиста (может называться по-другому, но суть та же).

В принципе, на этом уровне знаний можно работать годами, практикуясь в применении разных из уже изученных моделей, библиотек и инструментов, осваивая вспомогательные методы (feature engineering), нюансы, и способы решения похожих же задач, с помощью разных библиотек (xgboost, cat-boost). Постепенно будет уровень рост ЗП. Но это не уровень Senior специалиста.

Изучаем по необходимости, этапы 2-5

Визуализация данных

В какой-то момент времени вам потребуется уметь визуализировать данные, с которыми вы работаете. Имеет смысл активно это изучать тогда, когда вы будуте готовы сразу примененять эти знаний на практике, потому что иначе они не запоминаются. В Питоне существует несколько библиотек (привожу рекомендуемый порядок изучения):

matplotlib – на нём базируется следующие два варианта, и потенциально он может всё. Но тяжел и неэффективен для прямого использования, кроме построения уродливых графиков, для себя и коллег-технарей. Можно специально не учиться его применять, а понять только самые основы, которые будут «проступать» из-за других библиотек.

До начала применения в реальной практике, на обучение можно себя ограничить в 10-20ч на одну библиотеку.

Средства работы с данными

Можно учить на разных этапах, в зависимости от задач, с которыми столкнётесь

Основы regular expressions, aka RegExp (10ч). Знания regexp необходимо для продвинутой фильтрации данных в разных инструментах для работы с данными.

Внутри Spark устроен сильно не так, как обычные базы данных, но с точки зрения использования он оказывается сильно похожим, т.к. поддерживает почти стандартный SQL синтаксис или, как альтернативу, API отдалённо похожий на pandas. Определенные концептуальные отличия присутствуют, но больших сложностей в освоении это не вызывает. В последнее время продвигают библиотеку Koalas, которая будет использовать команды совсем как у pandas для работы с spark-кластером, но пока не советую делать это основным подходом по работе с Spark.

Этап 6

Углубление и развитие технических навыков

Если предыдущие этапы давали вам навыки, без которых работать ну вообще нельзя, то навыки этого этапа призваны повысить вашу продуктивность или повысить качество решаемых задач, повысить самостоятельность при запуске разработанных моделей машинного обучения в продакшн.

Уверенное пользование bash, понимание основ linux

Полезно изучить основы docker

Все эти вещи можно было бы учить и раньше. Но, как правило, раньше их знать просто не нужно. Т.к. вы больше будете страдать от нехватки других навыков, приведенных в предыдущих этапах.

Другие области машинного обучения

В какой-то момент вам может потребоваться выйти из сферы подготовки прогнозных моделей или изучения и объяснения данных (кластеризация, EDA и визуализация). Это может быть связано как с вашими интересами, так и с проектами на работе. Например, это могут быть рекомендательные системы. Наверное, базовые рекомендательные алгоритмы можно изучать и одновременно с основами машинного обучения, т.к. знание одного не является обязательным для знания другого. Но логичнее переходить к ним, когда вы уже разобрались с основными алгоритмами обучения прогнозирования и кластеризации: скорее всего, этого от вас будут ожидать любые коллеги до тех пор, как вы включитесь в работу над рекомендательными системами.

Нейронные сети

Начиная с этого этапа имеет смысл изучать нейронные сети как следует с тем, чтобы применять их на пратике. Неэффективно изучать их раньше, т.к. многие задачи эффективно можно решить другими методами. И пока ваши данные и прогнозы изначально числовые, обычно «классическими» методами их решать эффективнее.

Подробнее в этапы изучениях нейронных сетей вдаваться не стану: эта тема требует отдельной статьи. И потратить на них можно от 50, чтобы решать самые простейшие задачи, до сотен часов, чтобы решать задачи связанные с обработкой неструктурированных данных или с обучением сложных моделей.

Другие статьи

Готов выступить ментором в самообучении

self.development.mentor в домене gmail.com, Олег

Источник

Как стать
аналитиком данных

Зарплата
аналитика данных

Чему вы научитесь в Практикуме

За 6 месяцев обучения по 15 часов в неделю вы освоите востребованные навыки аналитика данных и соберёте портфолио проектов. Вот какие проекты вы будете делать на курсе:

Как выглядит процесс обучения

Обучение поделено на двухнедельные отрезки — спринты. Каждый спринт вы изучаете одну тему, закрепляете её на практике, сдаёте самостоятельную работу, а затем переходите к следующей теме.

Онлайн-тренажёр

С первого дня вы учитесь анализу данных на практике. Мы даём знания небольшими частями, которые нужно сразу применить, написав собственный код в онлайн-тренажёре.

Самостоятельная работа

Тренажёр — это только часть обучения. Основные навыки вы приобретете по мере решения задач инструментами профессиональных аналитиков, а код-ревьюер даст вам обратную связь.

Поддержка

Команда наставников проверяет и комментирует ваши работы, помогает разобраться в сложностях и обучает собственным профессиональным приёмам аналитики. Поддержка в чате доступна 24/7.

Аналитики учат аналитике

Наставники — аналитики из Яндекса и других IT-компаний. Некоторые из них, как и вы, не сразу выбрали свою профессию и тоже осваивали её с нуля.

71,1% выпускников трудоустраиваются

Мы делаем всё, чтобы студенты нашли новую работу после обучения: выдаём официальный диплом, учим собирать портфолио проектов, помогаем с поиском работы.

71,1% выпускников находят работу, большинство из них — за 4 месяца после выпуска. Институт образования НИУ ВШЭ подтвердил данные через исследование трудоустройства выпускников.

Сколько стоит обучение

Вводная часть —
бесплатно

Платное продолжение

12 500 ₽ помесячный платёж.
Итоговая сумма составит 75 000 ₽

70 000 ₽ при оплате сразу за
6 месяцев обучения.

Программа обучения

Основы Python и анализа данных: бесплатный вводный курс

Процесс и стадии работы аналитика: основные термины, задачи и инструменты анализа данных. Подготовка данных для анализа. Знакомство с языком программирования Python, аналитической библиотекой Pandas и средой программирования Jupyter.

+ 1 проект в портфолио

Введение в профессию «Аналитик данных»

Знакомство с профессией аналитика. Обзор областей, в которых может работать аналитик. Представление разных видов аналитики. Организационная часть процесса обучения.

Предобработка данных

Исследовательский анализ данных

Предварительный поиск закономерностей в данных даёт возможность сформулировать первые гипотезы для анализа, а также избежать странных ошибок. На курсе учимся использовать средства визуализации для работы с данными.

+ 1 проект в портфолио

Статистический анализ данных

В ходе работы с продуктом возникает масса гипотез, которые можно проверить понятными статистическими методами. Изучаем основы статистики и теории вероятностей для решения бизнес-задач.

+ 1 проект в портфолио

Сборный Проект — 1

Подготовка данных для анализа. Предварительное исследование датасета. Формулирование и проверка гипотез.

+ 1 проект в портфолио

Сбор и хранение данных

Как устроены базы данных, как извлекать данные из них, делая запросы на языке SQL. Добыча данных в интернете.

+ 1 проект в портфолио

Анализ бизнес-показателей

Ещё ближе к бизнесу — разбираем подробно, что такое метрики и основные инструменты: когортный анализ, воронка продаж и unit-экономика.

+ 1 проект в портфолио

Принятие решений в бизнесе на основе данных

A/B-тестирование: в каких случаях его использовать; проектирование, формирование выборки, получение результатов и их валидация.

+ 1 проект в портфолио

Как рассказать историю с помощью данных

Как правильно презентовать результаты своего исследования, оперируя графиками, важнейшими цифрами и их правильной интерпретацией.

+ 1 проект в портфолио

Сборный проект — 2

Получение данных из базы. Предобработка и обзор датасета. Формулирование гипотез с учётом специфики бизнеса. Проверка гипотез и подготовка выводов в формате аналитического отчёта.

+ 1 проект в портфолио

Автоматизация

Автоматизация процессов анализа данных. Превращение рутинных и постоянных задач в скрипты. Создание дашбордов для разных аудиторий и нужд компании.

+ 1 проект в портфолио

Прогнозы и предсказания

Основы машинного обучения, разбор задачи предсказания оттока пользователей.

+ 1 проект в портфолио

Выпускной проект

Самостоятельное решение аналитической задачи на выбор студента, со всеми стадиями анализа данных.

Источник

Самообучение в Data science, с нуля до Senior за два года

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли (отдельно планирую потом детальные статьи по отдельным темам).

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился.
Думаю, многим будут полезны «мета» материалы о том, как выбирать курсы и статьи, по которым учиться. Например, я пересмотрел десятки статей и книг, пробовал много разных он-лайн курсов, но полезной оказалась лишь малая часть всего доступного. Надеюсь, что смогу серьезно сэкономить вам время и помочь достигнуть большего, показав более эффективный путь самообучения.

И важно сказать сразу: я верю, что любой человек с аналитическими способностями и структурным мышлением может стать специалистом по машинному обучению/data science. Еще 4 года назад я сомневался, потеряв веру в свои математические способности из-за преподавателей университета. Теперь верю: основы машинного обучения и минимально необходимую математику сможет выучить любой сильно замотивированный человек.

Когда я понял, что скоро мне стукнет 30 лет, решил уйти в другую сферу и переехать из РФ. В своей сфере (1С) я был карьерно успешен, но стало ясно, что дальнейший рост очень затруднителен и требует выполнять работу, которая мне неинтересна и почти противна.

Через полгода перебора вариантов решил, что Data science мне интереснее всего.

Ещё через год имел достаточную квалификацию и прошёл собеседование на работу в Чехии (оговорка: у меня еще до этого было неплохое знание английского).

Ещё через год стал Senior Data scientist в Vodafone (мой LinkedIn).

Мне помогло то, что до этого я сформировал привычки к самообразованию, а экономность не позволила мне пойти по самому простому пути: найти онлайн курс с именитыми преподами, заплатить им много денег и довериться, что они всему научат лучше всего. В итоге я перебирал много бесплатно доступных книг и курсов (книги часто были найдены на b-ok.org). Из всех курсов и книг отбирал самые лучшие, забрасывая то, что казалось слишком теоретизированными или плохо структурированным.

На основе этих десятков книг и курсов я и сформировал то мнение, которым хочу поделить. Вероятно, существует еще более эффективный и быстрый способ научится этому всему. То, как учился я, было всего-лишь быстрее большинства платных программ, которые я видел, и заодно бесплатным (на многие лучшие англоязычные курсы всегда можно записаться бесплатно; покупал я только книги русских авторов и пару книг, которые иначе не смог найти).

Сначала надо понять, что такое Data science/машинное обучение и подойдет ли оно вам

Потому что если это просто модное слово и вы хотите получать много денег или работать в Гугл, то легче заработать на позиции маркетолога или веб-аналитика, и это тоже достаточно аналитичная работа.

Если вы человек творческий, возможно, разработка интерфейсов (фронтенд, мобильные приложения) вам подойдёт больше.

Если вы от природы аналитик и любите разбираться в данных, но программирование вас не заинтересует, а на изучение всей математики вам не хватает времени, стоит выбрать тот же самый учебный путь! Просто сделать акцент на мнее математических задачах, и не лезть в программироване сложных систем. Аналитики, знающие основы data science, тоже нужны в компаниях.

Важно, чтобы работа зажигала. Без искреннего интереса «грызть» Data science будет тяжело, потому что надо разобраться в куче нюансов, особенно если у вас нет за плечами хороших знаний в статистике, линейной алгебре и мат.анализе.

Как понять, будет ли вам интересно заниматься именно data science?

Мне кажется, что идеально эту роль выполняет книга Datasmart (выше писал сайт, на котором я нашёл её бесплатно). На русский она тоже переведена: «Много цифр. Анализ больших данных при помощи Excel, Джон Форман». Хотя, если вы хотите работать в data science, знание английского необходимо (технический английский выучить намного легче разговорного, и это будет очень полезно для любой работы в ИТ).

Эта книга показывет многие из технических методов Data science на уровне интуиции и даёт сразу достаточно детальное представление о решаемых задачах и где в бизнесе можно применить данные модели.

Если эта книга не вызовет интерес разобраться во всех указанных алгоритмах детальнее, вероятно, работа в data science не для вас.

Если книга интересн вызовет, но вам также хочется больше программировать, скорее всего, вам интересно будет стать machine learning engineer. Разница между data scientist и machine learning engineer в том, что первый должен общаться с людьми и понимать, какую задачу имеет смысл решать, а второй должен уметь состыковать программы с «искусственным интеллектом» с другими ИТ системами, мобильными телефонами или требованиями обрабатывать огромные объемы данных.

Что учить

Если вы решили, что готовы «грызть гранит науки», то в образовании специалиста data science есть два кита:

Непосредственные методы Data science, которые стоят на трёх математических черепахах: теории вероятностей и статистике, линейной алгебре и основах мат.анализа (только основах, там требуется минимум сверх школьного курса «алегбра и начало анализа»). Кстати, вся эта математика далеко не так сложна. Проблема в том, что её плохо и неинтересно объясняют во многих вузах. Позже поделюсь советами, как её можно легче освоить.

Программирование на Python (+SQL и подобные), которое позволит применить все изученные методы с помощью логичных и простых в своей сути библиотек готовых функций.

Даже примерный учебный план для изучения методов Data science требует отдельного поста. Ниже напишу чуть подробнее про Python и SQL

Английский необходим!

Принципы эффективного обучения

Программирование: что и как учить?

Что такое SQL и зачем его учить?

SQL является стандартом для получения данных в нужном виде из разных баз данных. Это тоже своеобразный язык программирования, который дополнительно к своему основному языку используют многие программисты. Большинство самых разных баз данных использует один и тот же язык с относительно небольшими вариациями.

Как учить SQL:

Наберите в Гугле «sql tutorial» и начните учиться по первой же ссылке. Если она вдруг окажется платной, выберете другую. По SQL полно качественных бесплатных курсов.

На русском языке тоже полно курсов. Выбирайте бесплатные.

На изучение достаточно всего лишь от 10 часов (общее понимание), до 20 часов (уверенное владение большей частью всего необходимого).

Почему именно Python?

У всех других языков программирования какие-либо специализированные библиотеки для машинного обучения есть только в зачаточном состоянии.

Как учить Python

Прочитать основы и пройти все упражнения с этого сайта можно за 5-40 часов, в зависимости от вашего предыдущего опыта.

После этого варианты (все эти книги есть и на русском):

Learning Python, by Mark Lutz (5 издание). Существует и на русском.

Есть много книг, которые сразу обучают использованию языка в практических задачах, но не дают полного представления о детальных возможностях языка.

Эта книга, наоборот, разбирает Python досконально. Поэтому по началу её чтение будет идти медленнее, чем аналоги. Но зато, прочтя её, вы будете способны разобраться во всём.

Я прочёл её почти целиком в поездах в метро за месяц. А потом сразу был готов писать целые программы, потому что самые основы были заложены в pythontutor.ru, а эта книга детально разжевывает всё.

В качестве практики берите, что угодно, когда дочитаете эту книгу до 32 главы, и решайте реальные примеры (кстати, главы 21-31 не надо стараться с первого раза запоминать детально. Просто пробежите глазами, чтобы вы понимали что вообще Python умеет).

Не надо эту книгу (и никакую другую) стараться вызубрить и запомнить все детали сразу. Просто позже держите её под рукой и обращайтесь к ней при необходимости.

Прочитав эту книгу, и придя на первую работу с кучей опытных коллег, я обнаружил, что некоторые вещи знаю лучше них.

Python Crash Course, by Eric Matthes

Automate the Boring Stuff with Python

Книга хороша примерами того, что можно делать с помощью Python. Рекомендую просмотреть их все, т.к. они уже похожи на реальные задачи, с которыми приходится сталкиваться на практике, в том числе специалисту по анализу данных.

Какие трудозатраты?

Путь с нуля до уровня владения Python, на котором я что-то уже мог, занял порядка 100ч. Через 200ч я уже чувствовал себя уверенно и мог работать над проектом вместе с коллегами.

Следующие статьи по данной теме

Для желающих могу выступить в роли ментора

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *