Специалист по большим данным
Программа ориентирована на формирование устойчивых навыков анализа и визуализации данных с использованием языка Python и популярных библиотек, включая Pandas, NumPy, Matplotlib и Seaborn. Обучение проходит в формате персональных онлайн-занятий — преподаватель работает с вами индивидуально, подстраивая темп и сложность материала под ваш уровень и цели.
Программа соответствует требованиям ФГОС СПО 09.02.13 «Интеграция решений с применением технологий искусственного интеллекта» и разработана с учётом положений профессионального стандарта 06.041 «Специалист по большим данным».
Объём программы составляет 256 академических часов
▪ 160 часов выделено на занятия с преподавателем — отработку теории и практики
▪ 96 часов отведено на самостоятельную проработку и реализацию проектов
Документ по окончании
📜 Диплом о профессиональной переподготовке — при наличии среднего профессионального или высшего образования
📜 Сертификат о прохождении курса — при несоответствии требуемому уровню образования
Содержание
- 4 модуля
- 160 уроков
- 160 часов
- Модуль 1. Программирование на языке Python40
- 1.1Основы синтаксиса, переменные, типы данных
- 1.2Практическая работа №1. Установка Python и запуск первой программы
- 1.3Переменные и типы данных
- 1.4Практическая работа №2. Работа с переменными и типами данных
- 1.5Операторы в Python
- 1.6Практическая работа №3. Вычисления и логические операции в Python
- 1.7Условные конструкции
- 1.8Практическая работа №4. Программы с условными операторами
- 1.9Циклы в Python
- 1.10Практическая работа №5. Написание циклических программ
- 1.11Работа со строками
- 1.12Практическая работа №6. Обработка строк
- 1.13Списки и кортежи
- 1.14Практическая работа №7. Работа со списками
- 1.15Словари и множества
- 1.16Практическая работа №8. Использование словарей
- 1.17Генераторы списков, тернарный оператор
- 1.18Практическая работа №9. Оптимизация кода с генераторами и lambda функциями
- 1.19Итоговые задания по структурам данных
- 1.20Практическая работа №10. Задачи на работу со структурами данных
- 1.21Функции в Python: основы
- 1.22Практическая работа №11. Создание пользовательских функций
- 1.23Передача аргументов, *args, **kwargs
- 1.24Практическая работа №12. Работа с *args и **kwargs в пользовательских функциях
- 1.25Рекурсия в Python
- 1.26Практическая работа №13. Реализация рекурсивных алгоритмов
- 1.27Генераторы и итераторы
- 1.28Практическая работа №14. Написание собственных генераторов данных
- 1.29Работа с файлами: чтение и запись
- 1.30Практическая работа №15. Работа с файлами: чтение и запись данных
- 1.31Работа с CSV и JSON файлами
- 1.32Практическая работа №16. Чтение и запись данных в CSV и JSON
- 1.33Обработка ошибок и исключения
- 1.34Практическая работа №17. Обработка ошибок в пользовательских программах
- 1.35Работа с регулярными выражениями (re)
- 1.36Практическая работа №18. Поиск и замена данных с использованием регулярных выражений
- 1.37Основы ООП в Python
- 1.38Практическая работа №19. Создание классов и объектов
- 1.39Наследование, инкапсуляция и полиморфизм
- 1.40Практическая работа №20. Реализация наследования и полиморфизма в Python
- Анализ данных на Python (Pandas, NumPy)40
- 2.1Введение в анализ данных и инструменты
- 2.2Практическая работа №1. Установка Pandas и NumPy, создание первых объектов
- 2.3Основы работы с NumPy
- 2.4Практическая работа №2. Операции с массивами NumPy
- 2.5Основы работы с Pandas
- 2.6Практическая работа №3. Создание и модификация DataFrame
- 2.7Чтение и запись CSV-файлов
- 2.8Практическая работа №4. Чтение и запись данных в CSV
- 2.9Работа с Excel-файлами
- 2.10Практическая работа №5. Обработка Excel-файлов в Pandas
- 2.11Подключение к базам данных (SQLAlchemy)
- 2.12Практическая работа №6. Подключение к базе и выполнение SQL-запросов в Pandas
- 2.13Фильтрация данных в Pandas
- 2.14Практическая работа №7. Фильтрация данных в DataFrame
- 2.15Группировка данных и агрегация
- 2.16Практическая работа №8. Группировка и агрегация данных
- 2.17Сводные таблицы (Pivot Table)
- 2.18Практическая работа №9. Создание сводной таблицы для анализа данных
- 2.19Объединение и слияние данных
- 2.20Практическая работа №10. Слияние и объединение нескольких таблиц
- 2.21Работа с временными рядами
- 2.22Практическая работа №11. Работа с датами и временными рядами
- 2.23Декомпозиция временных рядов
- 2.24Практическая работа №12. Анализ трендов временного ряда
- 2.25Визуализация данных
- 2.26Практическая работа №13. Визуализация данных с Matplotlib и Seaborn
- 2.27Обнаружение и обработка пропущенных данных
- 2.28Практическая работа №14. Обработка пропущенных данных в DataFrame
- 2.29Работа с выбросами и аномалиями
- 2.30Практическая работа №15. Поиск и устранение выбросов в данных
- 2.31Кодирование категориальных переменных
- 2.32Практическая работа №16. Кодирование категориальных данных
- 2.33Нормализация и стандартизация данных
- 2.34Практическая работа №17. Нормализация данных для анализа
- 2.35Оптимизация работы с большими таблицами
- 2.36Практическая работа №18. Оптимизация работы с большими наборами данных
- 2.37Автоматизация анализа данных
- 2.38Практическая работа №19. Автоматизация отчетов в Pandas
- 2.39Итоговый проект по анализу данных
- 2.40Практическая работа №20. Финальный проект по анализу данных
- Модуль 3. Визуализация данных на Python40
- 3.1Введение в визуализацию данных и библиотеку Matplotlib
- 3.2Практическая работа №1. Построение первых графиков с Matplotlib
- 3.3Работа с линейными графиками
- 3.4Практическая работа №2. Создание линейного графика с аннотациями
- 3.5Гистограммы и столбчатые диаграммы
- 3.6Практическая работа №3. Визуализация распределения данных с помощью гистограмм
- 3.7Круговые диаграммы и тепловые карты
- 3.8Практическая работа №4. Визуализация пропорций с помощью круговых диаграмм
- 3.9Введение в работу с временными рядами
- 3.10Практическая работа №5. Визуализация временного ряда (цены акций, погода)
- 3.11Скользящее среднее и тренды во временных рядах
- 3.12Практическая работа №6. Анализ сезонности временного ряда с помощью Matplotlib
- 3.13Графики временных рядов с Seaborn
- 3.14Практическая работа №7. Анализ временных рядов с Seaborn
- 3.15Визуализация нескольких временных рядов на одном графике
- 3.16Практическая работа №8. Визуализация сравнения двух временных рядов
- 3.17Основы Plotly: построение интерактивных графиков
- 3.18Практическая работа №9. Создание интерактивного линейного графика с Plotly
- 3.19Взаимодействие с пользователем в интерактивных графиках
- 3.20Практическая работа №10. Добавление интерактивных элементов в график
- 3.21Построение интерактивных временных рядов в Plotly
- 3.22Практическая работа №11. Визуализация временного ряда с анимацией
- 3.23Интерактивные тепловые карты и геоданные
- 3.24Практическая работа №12. Построение интерактивной карты данных
- 3.25Диаграммы рассеяния и регрессия в Seaborn
- 3.26Практическая работа №13. Визуализация корреляции данных с Seaborn
- 3.27Ящиковые диаграммы (boxplot) и violinplot
- 3.28Практическая работа №14. Анализ распределения данных с помощью boxplot
- 3.29Построение корреляционных матриц
- 3.30Практическая работа №15. Визуализация корреляции переменных с Seaborn
- 3.31Генерация отчетов в Jupyter Notebook
- 3.32Практическая работа №16. Создание интерактивного отчета в Jupyter Notebook
- 3.33Создание автоматизированных отчетов в Python
- 3.34Практическая работа №17. Автоматическая генерация отчетов с Python
- 3.35Динамическая визуализация данных в Streamlit
- 3.36Практическая работа №18. Разработка веб-интерфейса для анализа данных
- 3.37Визуализация данных в бизнес-аналитике
- 3.38Практическая работа №19. Создание аналитического дашборда
- 3.39Итоговый проект по визуализации данных
- 3.40Практическая работа №20. Финальный проект по визуализации данных
- Модуль 4. Автоматизация обработки и анализа данных на Python40
- 4.1Введение в автоматизацию обработки данных
- 4.2Практическая работа №1. Автоматическая очистка данных с Pandas
- 4.3Обнаружение и обработка пропущенных данных
- 4.4Практическая работа №2. Заполнение пропущенных данных различными методами
- 4.5Работа с выбросами и дубликатами
- 4.6Практическая работа №3. Поиск и удаление выбросов и дубликатов
- 4.7Преобразование типов данных и нормализация
- 4.8Практическая работа №4. Приведение данных к единому формату
- 4.9Генерация отчетов в Excel
- 4.10Практическая работа №5. Создание автоматического отчета в Excel
- 4.11Автоматическое создание PDF-отчетов
- 4.12Практическая работа №6. Создание динамического отчета в PDF
- 4.13Создание интерактивных дашбордов
- 4.14Практическая работа №7. Разработка интерактивного дашборда в Streamlit
- 4.15Автоматизация отчетности и отправка данных
- 4.16Практическая работа №8. Автоматическая отправка отчета на email
- 4.17Работа с внешними API
- 4.18Практическая работа №9. Получение данных из REST API
- 4.19Парсинг данных с веб-страниц
- 4.20Практическая работа №10. Парсинг цен на товары с сайта
- 4.21Работа с динамическими веб-страницами
- 4.22Практическая работа №11. Автоматизация сбора данных с динамических страниц
- 4.23Интеграция с облачными сервисами
- 4.24Практическая работа №12. Подключение Python-приложения к Google Sheets и Telegram API
- 4.25Оптимизация работы с большими CSV-файлами
- 4.26Практическая работа №13. Обработка большого CSV-файла без потери производительности
- 4.27Работа с базами данных для больших данных
- 4.28Практическая работа №14. Оптимизация SQL-запросов для работы с большими данными
- 4.29Обработка данных в многопоточном режиме
- 4.30Практическая работа №15. Разделение обработки данных на потоки
- 4.31Работа с распределёнными вычислениями
- 4.32Практическая работа №16. Обработка больших данных с Dask
- 4.33Профилирование и отладка кода
- 4.34Практическая работа №17. Оптимизация обработки данных и поиск узких мест
- 4.35Использование кеширования для ускорения работы
- 4.36Практическая работа №18. Оптимизация обработки данных с кешированием
- 4.37Автоматизированное тестирование данных
- 4.38Практическая работа №19. Разработка тестов для проверки качества данных
- 4.39Итоговый проект по автоматизации анализа данных
- 4.40Практическая работа №20. Разработка системы автоматизированного анализа данных
Требования
- Уверенное владение ПК
- Наличие гарнитуры и стабильного интернета
- Установленная среда разработки (рекомендации по установке даются в начале курса)
Особенности
- Обучение без воды – только актуальные знания, которые применяются в реальных задачах
- Полноценная практика – каждую тему сопровождают практические задания
- Работа с преподавателем – разбор ошибок и помощь
- Выбор формата обучения – персональный
- Выдача документа – удостоверение о повышении квалификации или сертификат о прохождении курса
Целевая аудитория
- Начинающие специалисты по данным
- Python‑разработчики, стремящиеся перейти в Data Science
- Студенты и выпускники технических направлений
- Аналитики и исследователи, желающие визуализировать данные
- Специалисты, автоматизирующие отчёты и обработку данных