Специалист по большим данным
Программа профессиональной переподготовки «Data Science на Python: анализ и визуализация данных» создана для тех, кто хочет уверенно работать с данными: от первичной обработки до построения визуализаций и автоматизации отчётности. Обучение охватывает весь спектр задач аналитика – от изучения Python до создания дашбордов и работы с большими данными в многопоточном и распределённом режиме.
Программа соответствует требованиям ФГОС СПО 09.02.13 «Интеграция решений с применением технологий искусственного интеллекта» и ориентирована на формирование практических навыков, востребованных в Data Science и бизнес‑аналитике.
Формат обучения
Обучение проводится в группе в онлайн‑формате по расписанию – понедельник и четверг с 19:00 до 21:10 по московскому времени (по 2 академических пары).
Период обучения – с 1 сентября 2025 года по 15 февраля 2026 года, с учётом праздничных и выходных дней.
По желанию обучение доступно в персональном формате (1 на 1 с преподавателем).
Структура и объём обучения
Программа включает 4 модуля по 40 академических часов занятий с преподавателем.
Общий объём – 256 академических часов, из которых:
▪ 160 часов – онлайн‑занятия с преподавателем
▪ 96 часов – самостоятельная работа и выполнение практических заданий
Документ по окончании
📜 Диплом о профессиональной переподготовке – при наличии среднего профессионального или высшего образования
📜 Сертификат о прохождении курса – при несоответствии требуемому уровню образования
Содержание
- 4 модуля
- 160 уроков
- 160 часов
- Модуль 1. Программирование на языке Python40
- 1.1Основы синтаксиса, переменные, типы данных
- 1.2Практическая работа №1. Установка Python и запуск первой программы
- 1.3Переменные и типы данных
- 1.4Практическая работа №2. Работа с переменными и типами данных
- 1.5Операторы в Python
- 1.6Практическая работа №3. Вычисления и логические операции в Python
- 1.7Условные конструкции
- 1.8Практическая работа №4. Программы с условными операторами
- 1.9Циклы в Python
- 1.10Практическая работа №5. Написание циклических программ
- 1.11Работа со строками
- 1.12Практическая работа №6. Обработка строк
- 1.13Списки и кортежи
- 1.14Практическая работа №7. Работа со списками
- 1.15Словари и множества
- 1.16Практическая работа №8. Использование словарей
- 1.17Генераторы списков, тернарный оператор
- 1.18Практическая работа №9. Оптимизация кода с генераторами и lambda функциями
- 1.19Итоговые задания по структурам данных
- 1.20Практическая работа №10. Задачи на работу со структурами данных
- 1.21Функции в Python: основы
- 1.22Практическая работа №11. Создание пользовательских функций
- 1.23Передача аргументов, *args, **kwargs
- 1.24Практическая работа №12. Работа с *args и **kwargs в пользовательских функциях
- 1.25Рекурсия в Python
- 1.26Практическая работа №13. Реализация рекурсивных алгоритмов
- 1.27Генераторы и итераторы
- 1.28Практическая работа №14. Написание собственных генераторов данных
- 1.29Работа с файлами: чтение и запись
- 1.30Практическая работа №15. Работа с файлами: чтение и запись данных
- 1.31Работа с CSV и JSON файлами
- 1.32Практическая работа №16. Чтение и запись данных в CSV и JSON
- 1.33Обработка ошибок и исключения
- 1.34Практическая работа №17. Обработка ошибок в пользовательских программах
- 1.35Работа с регулярными выражениями (re)
- 1.36Практическая работа №18. Поиск и замена данных с использованием регулярных выражений
- 1.37Основы ООП в Python
- 1.38Практическая работа №19. Создание классов и объектов
- 1.39Наследование, инкапсуляция и полиморфизм
- 1.40Практическая работа №20. Реализация наследования и полиморфизма в Python
- Анализ данных на Python (Pandas, NumPy)40
- 2.1Введение в анализ данных и инструменты
- 2.2Практическая работа №1. Установка Pandas и NumPy, создание первых объектов
- 2.3Основы работы с NumPy
- 2.4Практическая работа №2. Операции с массивами NumPy
- 2.5Основы работы с Pandas
- 2.6Практическая работа №3. Создание и модификация DataFrame
- 2.7Чтение и запись CSV-файлов
- 2.8Практическая работа №4. Чтение и запись данных в CSV
- 2.9Работа с Excel-файлами
- 2.10Практическая работа №5. Обработка Excel-файлов в Pandas
- 2.11Подключение к базам данных (SQLAlchemy)
- 2.12Практическая работа №6. Подключение к базе и выполнение SQL-запросов в Pandas
- 2.13Фильтрация данных в Pandas
- 2.14Практическая работа №7. Фильтрация данных в DataFrame
- 2.15Группировка данных и агрегация
- 2.16Практическая работа №8. Группировка и агрегация данных
- 2.17Сводные таблицы (Pivot Table)
- 2.18Практическая работа №9. Создание сводной таблицы для анализа данных
- 2.19Объединение и слияние данных
- 2.20Практическая работа №10. Слияние и объединение нескольких таблиц
- 2.21Работа с временными рядами
- 2.22Практическая работа №11. Работа с датами и временными рядами
- 2.23Декомпозиция временных рядов
- 2.24Практическая работа №12. Анализ трендов временного ряда
- 2.25Визуализация данных
- 2.26Практическая работа №13. Визуализация данных с Matplotlib и Seaborn
- 2.27Обнаружение и обработка пропущенных данных
- 2.28Практическая работа №14. Обработка пропущенных данных в DataFrame
- 2.29Работа с выбросами и аномалиями
- 2.30Практическая работа №15. Поиск и устранение выбросов в данных
- 2.31Кодирование категориальных переменных
- 2.32Практическая работа №16. Кодирование категориальных данных
- 2.33Нормализация и стандартизация данных
- 2.34Практическая работа №17. Нормализация данных для анализа
- 2.35Оптимизация работы с большими таблицами
- 2.36Практическая работа №18. Оптимизация работы с большими наборами данных
- 2.37Автоматизация анализа данных
- 2.38Практическая работа №19. Автоматизация отчетов в Pandas
- 2.39Итоговый проект по анализу данных
- 2.40Практическая работа №20. Финальный проект по анализу данных
- Модуль 3. Визуализация данных на Python40
- 3.1Введение в визуализацию данных и библиотеку Matplotlib
- 3.2Практическая работа №1. Построение первых графиков с Matplotlib
- 3.3Работа с линейными графиками
- 3.4Практическая работа №2. Создание линейного графика с аннотациями
- 3.5Гистограммы и столбчатые диаграммы
- 3.6Практическая работа №3. Визуализация распределения данных с помощью гистограмм
- 3.7Круговые диаграммы и тепловые карты
- 3.8Практическая работа №4. Визуализация пропорций с помощью круговых диаграмм
- 3.9Введение в работу с временными рядами
- 3.10Практическая работа №5. Визуализация временного ряда (цены акций, погода)
- 3.11Скользящее среднее и тренды во временных рядах
- 3.12Практическая работа №6. Анализ сезонности временного ряда с помощью Matplotlib
- 3.13Графики временных рядов с Seaborn
- 3.14Практическая работа №7. Анализ временных рядов с Seaborn
- 3.15Визуализация нескольких временных рядов на одном графике
- 3.16Практическая работа №8. Визуализация сравнения двух временных рядов
- 3.17Основы Plotly: построение интерактивных графиков
- 3.18Практическая работа №9. Создание интерактивного линейного графика с Plotly
- 3.19Взаимодействие с пользователем в интерактивных графиках
- 3.20Практическая работа №10. Добавление интерактивных элементов в график
- 3.21Построение интерактивных временных рядов в Plotly
- 3.22Практическая работа №11. Визуализация временного ряда с анимацией
- 3.23Интерактивные тепловые карты и геоданные
- 3.24Практическая работа №12. Построение интерактивной карты данных
- 3.25Диаграммы рассеяния и регрессия в Seaborn
- 3.26Практическая работа №13. Визуализация корреляции данных с Seaborn
- 3.27Ящиковые диаграммы (boxplot) и violinplot
- 3.28Практическая работа №14. Анализ распределения данных с помощью boxplot
- 3.29Построение корреляционных матриц
- 3.30Практическая работа №15. Визуализация корреляции переменных с Seaborn
- 3.31Генерация отчетов в Jupyter Notebook
- 3.32Практическая работа №16. Создание интерактивного отчета в Jupyter Notebook
- 3.33Создание автоматизированных отчетов в Python
- 3.34Практическая работа №17. Автоматическая генерация отчетов с Python
- 3.35Динамическая визуализация данных в Streamlit
- 3.36Практическая работа №18. Разработка веб-интерфейса для анализа данных
- 3.37Визуализация данных в бизнес-аналитике
- 3.38Практическая работа №19. Создание аналитического дашборда
- 3.39Итоговый проект по визуализации данных
- 3.40Практическая работа №20. Финальный проект по визуализации данных
- Модуль 4. Автоматизация обработки и анализа данных на Python40
- 4.1Введение в автоматизацию обработки данных
- 4.2Практическая работа №1. Автоматическая очистка данных с Pandas
- 4.3Обнаружение и обработка пропущенных данных
- 4.4Практическая работа №2. Заполнение пропущенных данных различными методами
- 4.5Работа с выбросами и дубликатами
- 4.6Практическая работа №3. Поиск и удаление выбросов и дубликатов
- 4.7Преобразование типов данных и нормализация
- 4.8Практическая работа №4. Приведение данных к единому формату
- 4.9Генерация отчетов в Excel
- 4.10Практическая работа №5. Создание автоматического отчета в Excel
- 4.11Автоматическое создание PDF-отчетов
- 4.12Практическая работа №6. Создание динамического отчета в PDF
- 4.13Создание интерактивных дашбордов
- 4.14Практическая работа №7. Разработка интерактивного дашборда в Streamlit
- 4.15Автоматизация отчетности и отправка данных
- 4.16Практическая работа №8. Автоматическая отправка отчета на email
- 4.17Работа с внешними API
- 4.18Практическая работа №9. Получение данных из REST API
- 4.19Парсинг данных с веб-страниц
- 4.20Практическая работа №10. Парсинг цен на товары с сайта
- 4.21Работа с динамическими веб-страницами
- 4.22Практическая работа №11. Автоматизация сбора данных с динамических страниц
- 4.23Интеграция с облачными сервисами
- 4.24Практическая работа №12. Подключение Python-приложения к Google Sheets и Telegram API
- 4.25Оптимизация работы с большими CSV-файлами
- 4.26Практическая работа №13. Обработка большого CSV-файла без потери производительности
- 4.27Работа с базами данных для больших данных
- 4.28Практическая работа №14. Оптимизация SQL-запросов для работы с большими данными
- 4.29Обработка данных в многопоточном режиме
- 4.30Практическая работа №15. Разделение обработки данных на потоки
- 4.31Работа с распределёнными вычислениями
- 4.32Практическая работа №16. Обработка больших данных с Dask
- 4.33Профилирование и отладка кода
- 4.34Практическая работа №17. Оптимизация обработки данных и поиск узких мест
- 4.35Использование кеширования для ускорения работы
- 4.36Практическая работа №18. Оптимизация обработки данных с кешированием
- 4.37Автоматизированное тестирование данных
- 4.38Практическая работа №19. Разработка тестов для проверки качества данных
- 4.39Итоговый проект по автоматизации анализа данных
- 4.40Практическая работа №20. Разработка системы автоматизированного анализа данных
Требования
- Уверенное владение компьютером – работа с браузером, файлами и программами
- Стабильный доступ к интернету
- Знания в программировании не требуются – курс начинается с нуля
Особенности
- Овладеете Python для аналитики – переменные, циклы, функции, структуры данных, файлы, регулярные выражения и основы ООП
- Проанализируете данные с помощью Pandas и NumPy – фильтрация, группировка, работа с временными рядами, пропусками и аномалиями
- Построите качественную визуализацию – с использованием Matplotlib, Seaborn, Plotly и Streamlit, от простых графиков до интерактивных дашбордов
- Автоматизируете анализ и отчётность – генерация PDF и Excel‑отчётов, интеграция с API, парсинг, многопоточность, оптимизация и кеширование
- Выполните реальные проекты – по анализу, визуализации и автоматизации обработки больших объёмов данных
Целевая аудитория
- Новички, начинающие путь в Data Science
- Студенты и выпускники технических направлений
- Специалисты по Excel, переходящие на Python
- Аналитики, желающие автоматизировать рутинные процессы
- Все, кто хочет получить новую профессию в сфере работы с данными