Специалисты по Data Science нужны везде, где хранят и обрабатывают большие объёмы данных
Ещё их называют дата-сайентистами — Data Scientist
Освоите профессию с нуля и за 13 месяцев

Мощный набор навыков и инструментов

Это сейчас действительно актуально и требуется во всех вакансиях.

Python
Jupyter Notebook
Git
SQL
Командная строка
Pandas
NumPy
Matplotlib
Seaborn
Scipy
Scikit-learn
Catboost
Lightgbm / Хgboost
Shap
Optuna
AirFlow
MLFlow
Spark
Hugging Face
Pytorch

Прозрачный карьерный рост

Вот средние зарплаты Data Scientist. Вы начнёте с junior позиции.

Источник данных: Хабр Карьера
119 000 ₽
Junior — опыт до 1 года
224 000 ₽
Middle — опыт 1–3 года
365 000+ ₽
Senior — опыт от 3 лет
Регулярно обновляем программу, чтобы вы проходили только актуальное
Есть базовый и расширенный форматы — со вторым вы быстрее вырастете до уровня middle
7 тем・1 проект・~8 часов
Бесплатно
Основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимается Data Scientist. А после бесплатной части выберете подходящий формат курса: базовый или расширенный.
  • Python
  • Pandas
  • Seaborn
  • Переменные
  • Типы данных
  • Гипотезы
  • Ошибки
  • Тепловые карты
  • Базовый и расширенный формат
Moscow Catnamycs
Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.
Ошибки в коде
Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.
Переменные и типы данных
Переменные. Типы данных. Арифметические операции с числами и строками.
Как выдвигать гипотезы
Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.
Работа в области данных
Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.
Машинное обучение
Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм k-ближайших соседей (kNN). Библиотека Scikit-learn.
Примените методы группировки и суммы, сегментируете пользователей и решите задачи классификации
1
3 темы・3 проекта・7 недель
Основы анализа данных с помощью SQL
  • Базы данных
  • СУБД
  • SQL
  • PostgreSQL
  • Предобработка данных
  • EDA
  • Ad-hoc-задачи
Извлечение данных
Структура баз данных и язык SQL. Извлечение данных из таблиц, их фильтрация, сортировка и агрегация. Базовые конструкции SELECT, WHERE, GROUP BY и ORDER BY. Получение данных по техническому заданию. Формирование простых аналитических выборок.
Обработка данных
Соединение таблиц (JOIN). Подзапросы. Обработка пропущенных значений и дубликатов. Преобразование данных. Создание столбцов. Работу с датой и временем. Множественные операции. Сложные SQL‑запросы для подготовки данных к анализу.
Анализ данных и ad‑hoc‑задачи
Оконные функции: агрегирующие, ранжирующие, смещения. Аналитические приёмы для проведения исследовательского анализа данных (EDA). Решение ad‑hoc‑задач от бизнеса через оконные функции и комбинацию SQL‑инструментов.
Научитесь извлекать и обрабатывать данные с помощью SQL‑запросов. Будете решать ad‑hoc‑запросы разной сложности в исследовательском анализе данных.
1 проект・2 недели
Проект по модулю по SQL
Закрепите навыки извлечения данных с помощью SQL. Очистите и подготовите их для анализа, а потом соберёте витрину данных для решения ad‑hoc‑задачи бизнеса. Оформите отчёт с результатами.
2
4 темы・4 проекта・6 недель
Анализ данных с помощью Python
  • Python
  • Pandas
  • Numpy
  • Matplotlib
  • Seaborn
  • Jupyter Notebook
  • ООП
  • Терминал
  • Виртуальное окружение
  • Git
Основы Python
Базовый синтаксис. Простые алгоритмы. Переменные и типы данных. Работа со строками и списками. Логические выражения и условные операторы. Циклы и списковые включения. Вложенные конструкции, функции, множества и словари.
Предобработка данных
Ключевые техники подготовки данных к анализу. Основы библиотеки Pandas. Работа с датафреймами: индексация, фильтрация, обработка пропущенных значений и дубликатов. Преобразования. Категоризация. Работа с датой и временем.
Исследовательский анализ данных и визуализация
Выявление закономерностей и формулирование рекомендации на основе данных. Объединение датафреймов. Описательная статистика. Анализ взаимосвязей переменных. Построение сводных таблиц. Создание графиков для исследований.
Основы ООП и инструменты разработки для Data Science
Основы объектно-ориентированного программирования (ООП). Классы для предобработки данных. Работа с профессиональной средой разработки. Организация проектов на Python. Командная строка и терминал. Настройка виртуального окружения. Установка библиотек. Работа с Git и GitHub.
Напишете скрипт и подготовите данные для анализа. Проведёте исследовательский анализ с помощью Python. Настроите виртуальное окружение и репозиторий.
1 проект・2 недели
Проект по модулю по Python
Научитесь очищать и предварительно обрабатывать данные. Проведёте исследовательский анализ и визуализируете результаты. Подготовите рекомендации для бизнеса и презентуете их.
3
3 темы・3 проекта・6 недель
Основы машинного обучения и линейные модели
  • Python
  • Pandas
  • Scikit-learn
  • Регрессия
  • Классификация
  • Jupyter Notebook
  • Grid search CV
  • Метрики модели
Знакомство с ML и линейная регрессия
Построение и анализ первой модели. Понятие машинного обучения. Устройство данных. Типы задач. Оценка качества модели. Линейная регрессия и её обучение. Метрики и гиперпараметры.
Логистическая регрессия и задачи классификации
Базовый пайплайн построения и оценка моделей классификации. Различия в задачах классификации. Логистическая регрессия. Кросс‑валидация. Метрики accuracy, precision, recall, F1 и другие. Их интерпретация. Выбор метрики для конкретной задачи.
Опорные векторы и техники классификации
Создание устойчивых и интерпретируемых моделей. Методом опорных векторов — SVM. Применение его к задачам бинарной и многоклассовой классификации. Методы отбора признаков и калибровки моделей для повышения точности предсказаний.
Обучите модель линейной регрессии и рассчитаете метрики этой модели. Решите задачу классификации. Напишете пайплайн предобработки данных и построите несколько линейных моделей.
1 проект・2 недели
Проект по модулю по машинному обучению
Пройдёте полный цикл создания ML-решения: от предобработки данных и EDA до обучения моделей для задач регрессии и классификации, подбора гиперпараметров и выбора наилучшего решения с точки зрения метрик.
4
4 темы・4 проекта・8 недель
Модели на основе деревьев
  • KNN
  • Решающее дерево
  • Случайный лес
  • Bias-variance tradeoff
  • Бустинг
  • Градиентный бустинг
  • Optuna
  • LightGBM
  • XGBoost
  • CatBoost
  • Shap
Решающее дерево и KNN
Метрические алгоритмы — KNN. Решающие деревья: структура, принципы работы и ограничения. Проблемы переобучения. Методы регуляризации деревьев. Подбор гиперпараметров с помощью Optuna. Работа с данными для деревьев.
Ансамблирование моделей и Random Forest
Подходы к ансамблированию: бэггинг и стекинг. Метод случайного леса — Random Forest. Его отличие от бэггинга. Определение важности признаков. Работа с данными с временной структурой. Дисбаланс классов.
Бустинг и градиентный бустинг
Алгоритмы бустинга. Популярные библиотеки: LightGBM, XGBoost, CatBoost. Подбор гиперпараметров и интерпретация результатов моделей. Векторизация текстовых данных для их последующей обработки моделями.
Обучение без учителя
Снижение размерности и кластеризация. Выбор подходящего метод для задачи: PCA, t‑SNE, k‑means, DBSCAN. Оценка качества кластеризации. Исследование структуры данных и поиск закономерностей.
Выполните задачу регрессии с помощью KNN и решающего дерева. Обучите модель с несколькими деревьями решений и данными с дисбалансом классов. Поработаете с классификацией через градиентный бустинг.
1 проект・2 недели
Проект по модулю о моделях на основе деревьев
Будете строить решения на основе алгоритмов деревьев. Извлечёте данные с помощью SQL, проведёте их очистку и исследовательский анализ, подготовите признаки для обучения модели и поэкспериментируете с параметрами модели, чтобы добиться заданного уровня качества. Освоите валидацию и интерпретацию результатов модели. Оформите решение и логику работы модели в виде технической документации.
5
3 темы・3 проекта・6 недель
Валидация и тестирование моделей
  • Python
  • Pandas
  • NumPy
  • SciPy
  • Statsmodels
  • Scikit-learn
  • Airflow
  • SQL
  • PostgreSQL
  • Jupyter Notebook
  • Git
Внедрение и мониторинг моделей
Этапы жизненного цикла модели — внедрение и мониторинг. Организация пайплайнов расчёта модели в Airflow для инференса моделей. Мониторинг качества. Стабильность признаков и предсказаний. Выявление деградации модели. Переобучение.
Формулировка гипотез и основы статистики
Основы теории вероятностей и статистики. Случайные величины. Законы распределения данных. Нулевые и альтернативные гипотезы. Статистические тесты: t‑тест, множественная проверка гипотез. Оценка статистической значимости.
A/B‑тестирования и анализ экспериментов
Процесс проведения: от выбора метрик и расчёта размера выборки до анализа и проверки результатов с помощью статистических тестов (тест Манна‑Уитни, Z‑тест пропорций). Интерпретация результатов. Рекомендации для бизнеса.
Реализуете мониторинг качества модели через Airflow: напишете код, который автоматически читает данные за день и рассчитывает метрики. Проведёте A/B‑тест модели и проанализируете его результаты.
1 проект・2 недели
Проект по модулю о валидации и тестировании моделей
Пройдёте полный цикл работы с моделью машинного обучения в продакшн-среде: научитесь читать и дорабатывать готовый код, подготовите модель к инференсу и реализуете запуск модели на новых данных с помощью Airflow. Закрепите навыки работы с пайплайнами, автоматизацией процессов и системой контроля версий Git.
2 недели
Подготовка к собеседованиям по Data Science
Узнаете, как проходит техническая часть собеседований. Разберёте примеры задач, которые дают соискателям. Потренируетесь отвечать на вопросы, которые часто задают нанимающие менеджеры. Всё это позволит чувствовать себя уверенно на реальном интервью.
1 проект・3 недели
Итоговый проект базового курса
Подтвердите, что освоили новую профессию. Уточните задачу заказчика, выберете модель, исходя из требований бизнеса и ограничений. Самостоятельно пройдёте весь жизненный цикл обучения модели.
+5 тем・+4 проекта・+15 недель
Расширенный курс «Специалист по Data Science»
У этого курса есть расширенный формат: стоит дороже, но включает в себя больше тем и проектов, — чтобы усилить портфолио и повысить шансы на быстрое трудоустройство.
  • PySpark
  • MLFlow
  • Pytorch
  • Hugging Face
  • Implicit
  • Scikit learn
  • LightFM
  • Word2vec
Обработка больших данных
Работа с большими данными с помощью Apache Spark. Обработка распределённых датасетов. Оптимизация производительности. SQL в PySpark.
Трекинг экспериментов в MLflow
MLflow для логирования экспериментов и управления жизненным циклом моделей.
Введение в глубинное обучение и нейросети для изображений
Архитектура нейронных сетей: полносвязные, сверточные. Цикл обучения и валидации модели на фреймворке pytorch для изображений.
Нейронные сети для текстов
Модели на архитектуре трасформеров: BERT, GPT. Работа с векторным представленим текстов. Адаптация предобученной модели из Hugging Face.
Рекомендательные системы
Устройство контентных, коллаборативных и гибридных подходов. Выбор метрик. Реализация рекомендаций, готовых к внедрению в продакшн.
Дополнительный проект в Мастерской
В условиях, которые максимально приближены к реальным, выполните задачу бизнеса от настоящего заказчика. Поработаете с сырыми данными и обучите модель.
Погрузитесь в продвинутые темы: работа с большими данными, логирование экспериментов с параметрами модели, архитектура нейросетей. Узнаете подходы к построению рекомендательных систем и научитесь разрабатывать решения, готовые к запуску в продакшн.
1 проект・3 недели
Итоговый проект расширенного курса
Сможете выбрать, над чем поработать:
  • Созданием рекомендательной модели
  • Обучением модели с использованием PySpark и MLFlow
Карьерный центр・1 месяц
Карьерный трек: подготовка к трудоустройству
Составите резюме, которое привлечёт внимание рекрутеров, и напишете сопроводительное письмо для откликов на вакансии. Узнаете, как правильно оформлять портфолио, и построите стратегию поиска работы.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Карьерный центр・До 6 месяцев
Карьерный трек: акселерация
Акселерация — активный поиск работы с поддержкой HR‑экспертов. Будете откликаться на вакансии, делать тестовые и ходить на собеседования, а мы вас дистанционно поддержим. Например, расскажем, какие ошибки бывают в общении с работодателем и как их избежать. Акселерация может продолжаться до 6 месяцев — обычно этого достаточно, чтобы получить первую работу в IT.
Получите диплом о профессиональной переподготовке
Это официальный документ установленного образца, который принимают работодатели. Образовательная лицензия № Л035-01298-77/00185314 от 24 марта 2015 года.
Очень много практики
Ещё 7 месяцев после выпуска бесплатно помогаем с поиском работы — для этого у нас целый карьерный центр
10 000+ выпускников Практикума уже нашли новую работу
И сделали это в первые 4 месяца после учёбы. Это подтверждено исследованием, которое мы провели вместе с Высшей школой экономики. Вот в каких компаниях работают выпускники.
Как устроена учёба
В программе есть модуль по YandexGPT
Работодатели ценят специалистов, которые умеют работать с нейросетями
Увидите возможности нейросетей, научитесь использовать их в работе, поймёте, когда это безопасно и этично, а когда нет
С чем YandexGPT может помочь специалисту по Data Science:
  • с генерацией и проверкой гипотез
  • ответами на вопросы о методах и инструментах анализа
  • ведением документации
Эти выпускники уже стали специалистами по Data Science. Большинство — без опыта в IT
4,7
TutorTop
4,5
IRecommend
4,3
Отзовик

Попробуйте любой формат курса бесплатно — выбрать один-единственный можно позже

  • Специалист по Data Science

    Всё необходимое, чтобы стать junior специалистом по Data Science

    14 000 ₽/мес

    если платить частями в течение 13 месяцев
    или сразу, но дешевле —
    150 000 ₽

    Начать учиться бесплатно
    Python, Jupyter Notebook, SQL, Git, работа с командной строкой и виртуальным окружением, библиотеки для визуализации и анализа данных, библиотеки для машинного обучения, автоматизация пайплайнов в Airflow
    17 проектов, в том числе на реальных данных
    Подготовка к техническим собеседованиям
  • Специалист по Data Science расширенный

    То же самое + больше навыков, которые помогут найти работу и быстрее вырасти до middle

    15 000 ₽/мес

    если платить частями в течение 17 месяцев
    или сразу, но дешевле —
    198 000 ₽

    Начать учиться бесплатно
    Всё то же самое + 5 дополнительных тем: рекомендательные системы, нейросети для изображений, нейросети текста (Hugging Face, Pytorch), обработка больших данных (pySpark), трекинг экспериментов в MLflow
    То же самое + 5 проектов по дополнительным темам, чтобы усилить портфолио
    То же самое + работа в Мастерской  руководством экспертов над задачами от настоящих заказчиков
  • Ещё можно оплатить в кредит от 6 123 ₽/мес. А если передумаете, вернём деньги за остаток курса. Подробности — в 7 пункте оферты.
  • Курс может оплатить ваш работодатель
    или вы сами через свою компанию.
    чем отличаются условия для юрлиц.
Отвечаем на вопросы
Подойдёт ли мне эта профессия?
Для тех, кто сомневается, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что выбранная профессия вам не подходит, — это тоже положительный результат.
Можно ли освоить профессию Data Scientist с нуля за 13 месяцев?
На курсе вы получите всё, чтобы стать специалистом по Data Science. Но результат зависит от вас. Уделяйте курсу не меньше 15 часов в неделю, выполняйте практические задания, общайтесь с экспертами и всё получится.
Каким требованиям нужно соответствовать?
Вам не понадобятся специальные навыки или опыт — мы обучим всему с нуля. Главное — иметь компьютер и достаточно времени для занятий. Выше можно посмотреть программу обучения, чтобы оценить количество учебного материала и свои возможности.
Кто будет меня учить?
Все наставники — практикующие специалисты: сотрудники Яндекса и других крупных компаний. Программу составляют опытные преподаватели и методисты, а ещё действующие специалисты Яндекса, Школы анализа данных и других лидеров технологической и образовательной индустрий.
Смогу ли я найти работу после обучения?
Гарантий нет, но мы верим, что сможете. Работодателям важно, чтобы вы справлялись с реальными задачами, а не просто обладали набором знаний. Мы учим применять знания на практике, а также предлагаем помощь HR-специалистов из нашего карьерного центра. Но вам точно придётся приложить усилия, чтобы найти работу: активно откликаться на вакансии, проходить собеседования, показывать свои проекты и делать тестовые задания.

По данным исследования Высшей школы экономики, 69% наших выпускников среди тех, кто хотел сменить профессию, начинают новую карьеру после обучения. Больше половины из них — во время учёбы и в первые 2 месяца после выпуска. Эти цифры подкреплены публичным отчётом о трудоустройстве студентов Практикума.
А если я хочу работать в Яндексе?
Некоторые наши студенты работают в сервисах Яндекса, в том числе и в Практикуме. Но с нашей стороны было бы нечестно что-либо гарантировать и завышать ваши ожидания.

Без опыта попасть в крупную IT-компанию возможно, хотя и сложно. Программа составлена так, чтобы вы могли начать карьеру после выпуска и набраться первого опыта. С ним вам будет значительно проще претендовать на позицию в крупных компаниях.
Хорошо, а вы можете помочь с поиском работы?
Да. Вы сможете пройти карьерный трек, который состоит из 2 частей:

• Подготовка к трудоустройству: студенты при поддержке наших HR-экспертов составляют резюме или оформляют портфолио, пишут сопроводительные письма.
• Акселерация: студенты начинают активный поиск работы, а мы им помогаем — отвечаем на вопросы, проводим тренировочные собеседования, предлагаем вакансии от партнёров.

Обратите внимание: если курс оплачивает ваш работодатель, у вас не будет карьерного трека.
Что делать, если я не справлюсь с нагрузкой?
В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более поздний поток. На общую стоимость курса это не повлияет.
Если не понравится, я могу вернуть деньги?
Конечно. Если поток ещё не стартовал, вернём всю сумму. Если учёба уже началась, придётся оплатить прошедшие дни со старта вашего первого потока — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.
Получу ли я какой-то документ после курса?
Если у вас есть среднее профессиональное или высшее образование, после курса вы получите диплом о профессиональной переподготовке.

Если нет, выдадим сертификат о прохождении курса и справку об обучении в электронном виде.
Как можно оплатить?
Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию, если она налоговый резидент РФ. Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Можно ли оплатить курс за счёт работодателя?
Да, работодатель может оплатить учёбу полностью или разделить сумму с вами, например 50/50 или 75/25.

Такая оплата пройдёт по счёту или двустороннему договору, а ИП могут оплатить с бизнес-счёта. Если работодатель купит обучение сразу 10 сотрудникам или больше, сделаем скидку 10%.

Условия для юридических лиц и ИП отличаются — чтобы узнать подробнее, оставьте заявку или уточните у вашего менеджера.
Что такое налоговый вычет на обучение и как его получить?
Налоговый вычет может получить тот, кто работает по трудовому договору и является налоговым резидентом Российской Федерации, то есть 183 дня в году находится на территории страны.

Вот инструкция, которая поможет всё оформить.

Давайте поможем

Мы перезваниваем в течение 30 минут каждый день с 10:00 до 19:00. Если оставите заявку сейчас, то перезвоним уже в рабочее время.

Как планируете учиться?