<p>Курс: Аналитика данных на Python</p>

В ходе обучения вы приобретете профессиональные компетенции в области анализа данных. Вы научитесь осуществлять сбор, обработку и визуализацию данных, а также применять конкретные аналитические подходы при работе над реальными задачами с использованием языка программирования Python.

144 часа

Подробнее

Научитесь анализировать данные, чтобы повысить свою профессиональную ценности и открыть новые карьерные возможности.

Аналитик – обобщающее название для всех типов, деятельность которых состоит из сбора цифровых данных, анализа и его расшифровки. Данные, над которыми работает человек, зависят от особенностей и тонкостей профессиональной сферы. Количество областей, где нужны аналитики, растет: если раньше речь шла об инвестициях и финансах, то теперь специалисты требуются в инженерии, компьютерных технологиях, биологии, рекламе и т.д.

Самые популярные типы аналитиков:
• бизнес-аналитик
• финансовый аналитик
• дата-аналитик
• продуктовый аналитик

Выпускники программы научатся обрабатывать и анализировать и визуализировать данные, извлекать полезную информацию и на основании них принимать решения. Выпускники также научатся создавать, разрабатывать и внедрять системы обработки данных.

О программе курса

Чему вы научитесь за 144 часа

<p>Анализ данных</p>
<p>Методы обработки данных</p>
<p>Основы машинного обучения</p>

— Старт обучения на потоке 30 мая 2025 года
— Доступна оплата обучения в рассрочку
— Удостоверение о повышении квалификации после окончания курса
— Поддержка куратора в течении всего обучения
— Доступ к курсу на один год, включая все обновления
— Возможность оформить налоговый вычет

  • Дополнительная скидка 20% от цены программы при полной оплате до начала обучения - 49900р.
  • Скидка действительна для работников и членов семей работников Ростелекома и ДЗО.
  • Для остальных категорий стоимость обучения 65000р.
Модуль 1. Основы анализа данных на Python

Тема 1.1. Введение в анализ данных:
• Что такое анализ данных? Цели и задачи.
• Этапы анализа данных: сбор, очистка, анализ, визуализация.
• Применение аналитики данных в бизнесе, науке и технологиях.

Тема 1.2. Основы Python для анализа данных:
• Установка Python и среды разработки (Jupyter Notebook, PyCharm).
• Базовые конструкции языка: переменные, типы данных, операторы.
• Наборы данных.
• Встроенные функции и методы. 
• Создание собственных функций и модулей.
• Основы ООП.

Тема 1.3. Настройка среды разработки: JupyterLab, Google Colab, Kaggle:
• Установка Python и среды разработки (Jupyter Notebook, PyCharm).
• Базовые конструкции языка: переменные, типы данных, операторы.
• Наборы данных.
• Встроенные функции и методы. 
• Создание собственных функций и модулей.
• Основы ООП.

Тема 1.4. Очистка и предобработка данных:
• Виды данных: качественные данные, количественные данные, дискретные данные, непрерывные данные, бинарные данные, пространственные данные, временные данные, панельные данные.
• Обработка пропущенных значений.
• Работа с выбросами и аномалиями.
• Типизация данных и преобразования.

 

Модуль 2.  Инструменты анализа данных

Тема 2.1. Использование Pandas и NumPy для анализа данных
• Работа с данными с помощью Pandas
• Числовые вычисления с NumPy
• Обработка пропущенных данных и преобразование типов
• Анализ и агрегация данных

Тема 2.2. Анализ данных на Python с использованием методов статистики и машинного обучения:
• Подготовка и очистка данных
• Описательная статистика и визуализация
• Машинное обучение: обучение моделей
• Анализ и интерпретация результатов

Тема 2.3. Введение в библиотеки обработки данных (Scikit-learn, SciPy, TensorFlow):
• Реализации алгоритмов классификации с помощью библиотеки Scikit-learn
• Применение библиотеки для научных вычислений SciPy
• Обучения моделей глубокого обучения с применением мощной библиотеки TensorFlow

 

Модуль 3. Визуализация данных

Тема 3.1. Основы визуализации данных и принципы эффективного представления информации:
• Типы визуализаций и их назначение.
• Правила оформления графиков и диаграмм.
• Цветовые схемы и их влияние на восприятие.

Тема 3.2. Библиотеки для визуализации данных:
• Matplotlib, Seaborn, Plotly.
• Создание графиков: линейных, столбчатых, круговых.
• Построение распределений и корреляционных матриц.

Тема 3.3. Интерактивная визуализация:
• Использование библиотек для создания интерактивных графиков.
• Интеграция графиков в отчеты и презентации.

 

Модуль 4. Машинное обучение для анализа данных

Тема 4.1. Введение в машинное обучение:
• Задачи машинного обучения: классификация, регрессия, кластеризация.
• Обзор библиотек Scikit-learn, XGBoost / LightGBM / CatBoost, TensorFlow/PyTorch.

Тема 4.2. Построение моделей:
• Разделение данных на обучающую и тестовую выборки.
• Обучение моделей линейной регрессии, k-ближайших соседей, деревьев решений.

Тема 4.3. Оценка качества моделей:
• Метрики качества: точность, полнота, F1-мера.
• Кросс-валидация.
Тема 4.4. Автоматизация анализа данных с использованием Jupyter и Python.

 

 

Как проходит обучение

<p>Теоритические задания</p>
<p>Практические задания</p>
<p>Самостоятельная работа</p>
<p>Итоговая аттестация</p>

Ответы на вопросы

Мы рекомендуем уделять до 20 часов на обучение в неделю. Изучать материалы программы вы можете в любое время, главное — вовремя выполнять практические задания. 

По завершению обучения вы получите удостоверение о повышении квалификации установленного образца.

В начале обучения вы будете подключены к закрытому Telegram-чату, где сможете оперативно получить помощь от экспертов и команды поддержки, в случаях, если у вас возникнут сложности с изучением материалов.