Классическое образование
Классическое образование

Профессия

Введение в Data Science

21 января 2025старт программы

6 месяцевпродолжительность обучения

Записаться Задать вопрос

о курсе

Data Scientist — это специалист, который занимается анализом и интерпретацией больших объемов данных, а также созданием моделей и разработкой алгоритмов для оптимизации бизнес-процессов и принятия стратегических решений.

почему тгу

Лидируем в области онлайн-обучения и дополнительного образования более 25 лет

  • 4,8/5

    средняя оценка курсов

  • 1,5

    млн слушателей видеолекций

  • 97%

    нашли работу во время обучения

  • 100 000

    выпускников онлайн-курсов

После обучения

После обучения вы получите

  1. Hard skills

    Научитесь работать с данными из открытых источников с помощью различных библиотек языка Python (BeautifulSoap, Scrapy, Selenium, Requests), писать запросы на PostgreSQL, а также строить алгоритмы классического машинного обучения.

  2. Диплом о профессиональной переподготовке

    Диплом подтвердит ваши новые знания и навыки, а также поможет в продвижении по карьерной лестнице, при поиске новой работы или повышении зарплаты.

  3. Итоговый проект

    Решение кейса на реальных данных — поможет не только закрепить знания, но и продемонстрировать навыки и потенциал в данной области.

для кого курс

  1. Для тех, у кого нет опыта в сфере аналитики

    Курс подойдет новичкам в аналитике и работе с данными. Материалы курсов понятны каждому — кто только знакомится с профессией или продолжает обучение.

  2. Для опытных специалистов

    Если вы уже работаете в сфере анализа данных, курс поможет расширить арсенал инструментов и приобрести новые навыки в этой области.

  3. Для специалистов из разных областей

    Курс будет полезен специалистам из различных областей, желающим расширить свои знания в области аналитики данных или перейти в эту область.

обучение подойдет тем, кто хочет

  1. Получить востребованную специальность

    По данным аналитического сервиса РосНавык, за последний год было опубликовано более 90 000 вакансий, в которых требовался специалист по анализу данных или по машинному обучению.

  2. Расширить навыки

    Сможете проводить полный цикл анализа данных от поиска до построения алгоритмов машинного обучения, а также научитесь работать с языками Python и PostgreSQL.

  3. Увеличить доход

    Медианная заработная плата в данной области по данным сервиса РосНавык — 140 000 рублей.

программа курса

  • 336

    часов

  • 8

    разделов

  • 2

    тематических блока

  • Модуль 1. Основы Python для анализа данных

    Раздел 1.Основы Python

    Тема 1. Переменные Python
    • Понятие переменная
    • Типы данных в Python
    • Числа
    • Строки

    Тема 2. Структуры данных. Цикл for
    • Списки
    • Цикл for Вложенные списки
    • Словари
    • Список словарей
    • Кортежи
    • Множества
    • Файлы
    • Файлы: csv и json

    Тема 3. Условия и цикл while
    • Условные конструкции
    • Логические выражения и операторы сравнения
    • Цикл while

    Тема 4. Функции
    • Понятие функции, синтаксис
    • Параметры и аргументы функции
    • Локальные и глобальные переменные, анонимные функции

    Тема 5. Основные библиотеки для анализа данных
    • Работа с библиотеками и модулями
    • Требования к коду
    • Библиотека re
  • Модуль 2. Основы анализа данных

    Раздел 1. Поиск аналитических данных

    Тема 1. Методологии Data Mining
    • Этапы работы 
    • Данные 
    • Важные моменты и результат  

    Тема 2. Работа с данными
    • «Правильные данные»
    • Какие бывают данные? 
    • Бизнес-цели, требования к данным
    • Источники данных

    Тема 3. Методы и инструменты анализа
    • Методы и инструменты для анализа данных 
    • Какие навыки для этого необходимы

    Раздел 2. Сбор аналитических данных

    Тема 1. Сбор данных из открытых источников
    • Понятие API
    • Немного о REST и SOAP API
    • Краткий обзор HTTP
    • Знакомство с requests на примере API GitHub
    • Знакомство с API Кинопоиска и библиотекой JSON
    • Знакомство с API Headhunter и библиотекой CSV

    Тема 2. Парсинг данных
    • Знакомство с парсингом
    • Законность парсинга
    • HTML. CSS. XPath
    • Библиотека BeautifulSoup
    • Библиотека Selenium
    • Панель разработчика
    • Фреймворк Scrapy

    Тема 3. Оценка качества данных
    • Оценка качества данных

    Раздел 3. Чистка и предобработка данных

    Тема 1. Типичные проблемы данных в датасетах
    • Data Cleaning. Этапы очистки данных

    Тема 2. Библиотека Pandas
    • Подгрузка и обзор датасета
    • Объекты и типы данных в Pandas

    Тема 3. Работа с дубликатами, пропусками, вложенными структурами
    • Понятие признак, пропуск, дубликат
    • Работа с JSON-форматом
    • Обработка полных дубликатов

    Тема 4. Преобразование данных
    • Кодирование и декодирование информации
    • Модуль datetime. Метод astype()
    • Преобразование в формат целого числа, числа с плавающей точкой

    Тема 5. Работа с текстовыми данными
    • Методы Pandas для работы с текстовыми данными
    • Метод explode()
    • Проверка результатов очистки данных

    Раздел 4. Разведочный анализ данных

    Тема 1. Основы работы с данными
    • Введение в разведочный анализ данных
    • Подгрузка данных в среду (знакомство с DataFrame)
    • Оценка размеров датасета, наличия пропусков

    Тема 2. Анализ числовых данных
    • Неграфический анализ (медиана, квартили, среднее)
    • Анализ выбросов
    • Графический анализ: box-plot, гистограмма

    Тема 3. Анализ категориальных данных
    • Неграфический анализ (мода, количество уникальных значений)
    • Графический анализ: круговая диаграмма, столбчатая диаграмма

    Тема 4. Анализ взаимосвязи колонок 
    • Графический анализ взаимосвязи двух числовых переменных
    • Анализ взаимосвязи двух категориальных переменных
    • Анализ взаимосвязи категориальной и числовой переменных

    Тема 5. Фильтрация, группировка, параметры визуализации
    • Стили и общие параметры визуализации

    Раздел 5. Статистический анализ данных

    Тема 1. Введение в статистику
    • Типы данных и шкалы
    • Оценивание параметров
    • Числовые характеристики выборки
    • Проверка статистических гипотез
    • Алгоритм
    • Критерий согласия Пирсона
    • P-value

    Тема 2. Критерии сравнения групп
    • Общая постановка задачи
    • Параметрические и непараметрические критерии сравнения групп

    Тема 3. Корреляционный анализ
    • Введение в корреляционный анализ
    • Количественная корреляция
    • Парный коэффициент корреляции Пирсона
    • Ранговая корреляция
    • Корреляционный анализ категоризованных данных

    Тема 4. Регрессионный анализ
    • Введение в регрессионный анализ
    • Модель парной регрессии
    • Оценка параметров
    • Проверка качества уравнения парной регрессии
    • Множественная регрессия
      
    Раздел 6. Алгоритмы классического машинного обучения

    Тема 1. Введение
    • Типы данных и их свойства
    • Введение в ML

    Тема 2. Продвинутый регрессионный анализ
    • Введение в продвинутый регрессионный анализ
    • Нелинейные модели регрессии
    • Линеаризация
    • Оценка параметров линейной модели регрессии
    • Проверка качества моделей
    • Деревья регрессии
    • Оценка параметров модели регрессии
    • Проверка качества моделей регрессии
    • Прогнозирование целевого показателя
    • Полиноминальная модель регрессии
    • Проблемы регрессионных моделей в машинном обучении: недообучение, переобучение
    • Дерево принятия решений

    Тема 3. Классификация
    • Введение в классификацию
    • Логистическая регрессия
    • Оценка качества алгоритма бинарной классификации
    • Алгоритм логистической регрессии
    • Дерево принятия решений
    • Наивный Байесовский классификатор
    • Метод опорных векторов
    • Метод K-ближайших соседей
    • Оценка качества алгоритма многоклассовой классификации
    • Оценка качества алгоритма бинарной классификации

    Тема 4. Кластеризация
    • Введение в кластеризацию
    • Меры расстояния
    • Методы объединения
    • Иерархическая кластеризация
    • Метод К-средних

    Раздел 7. SQL для работы с базами данных в PostgreSQL

    Тема 1. Введение в базы данных
    • Понятие база данных
    • Классификация, разные виды баз данных
    • Компоненты базы данных
    • Таблицы, колонки, строки данных, ключи таблиц

    Тема 2. Написание SELECT запросов
    • Структура SELECT запроса
    • Порядок написания команд
    • Операторы AS, WHERE, IN, NOT IN, LIKE, NOT LIKE, CASE, ORDER BY, DISTINCT

    Тема 3. Функции агрегации
    • Операторы GROUP BY, HAVING. Функции COUNT, AVG, SUM, MIN, MAX

    Тема 4. Подзапросы и табличные выражения
    • Применение подзапросов для фильтрации, для поэтапного преобразования данных
    • CTE (табличные выражения), синтаксис WITH cte_name AS (), применение нескольких табличных выражений

    Тема 5. Отношения таблиц
    • LEFT JOIN, RIGHT JOIN, INNER JOIN, FULL JOIN, CROSS JOIN

    Тема 6. Работа с таблицами, запись данных
    • CREATE TABLE, ALTER TABLE, DROP TABLE, TRUNCATE TABLE, INSERT INTO

    Тема 7. Работа с базами данных из Python
    • Обзор библиотек (sqlalchemy, psycopg2, ipython-sql)
    • Синтаксис подключения к базе данных

    Тема 8. Оконные функции
    • Оконные функции агрегации, ранжирования, смещения
    • Создание фрейма с помощью ROWS, GROUPS, RANGE

преподаватели курса

По завершении 6 месяцев обучения вы получите диплом ТГУ о профессиональной переподготовке установленного образца

  1. Команда сопровождения поддержит вас в обучении. После обучения поможем оформить резюме, а лучших студентов рекомендуем на работу.
  2. За короткое время пройдете материал, делая акцент на самом основном и достигните высоких результатов. Быстрее освоите материал, улучшите самодисциплину и научитесь эффективно и продуктивно работать в сжатые сроки.

резюме после обучения

Должность после обучения

Data-scientist

навыки

  • Программирование на Python, работа со структурами данных, файлами (CSV, JSON), функциями и условными конструкциями
  • Сбор и анализ данных: из открытых источников с использованием API и библиотек Python
  • Статистический анализ, проверка гипотез и корреляционный анализ
  • Применение алгоритмов классического машинного обучения
  • Управление базами данных на языке PostgreSQL
  • Визуализация и представление данных (box-plot, гистограммы, диаграммы)
  • Оценка качества данных и их предварительная очистка

инструменты

  • Python
  • PostgreSQL
  • Beautiful Soup
  • Scrapy
  • Selenium
  • Requests
  • Pandas

Зарплата
Data-scientist

По данным hh.ru

  • 60 000-80 000 р.

    опыт работы до 1 года

  • 80 000-200 000 р.

    опыт работы от 1 до 3-х лет

  • >200 000 р.

    опыт работы от 3-х лет

тгу в рейтингах

  • 7

    место рейтинга «Интерфакс» лучшие университеты России 2022 по параметру «Инновации»

  • 20

    место в рейтинге российских вузов по версии Forbes

  • 5

    место в рейтинге самых узнаваемых в мире
    российских вузов от Forbes

  • 2

    место в России в области
    технических наук

стоимость обучения

96 000р.

120 000р.

  • 6 месяцев обучения
  • Рассрочка на 3 платежа по 32 000р.
  • Верните 13% стоимости обучения — 12 480р.

Для обучения обязательно наличие среднего специального или высшего образования

-20%акция действует до 21 января

часто задаваемые вопросы

  • Могу ли я получить диплом о профессиональной переподготовке, если у меня нет высшего образования?

    Для получения диплома о профессиональной подготовке вам потребуется наличие законченного высшего или среднего специального образования.

    Если у вас нет высшего образования, рекомендуем рассмотреть курсы в формате видеолекций. Вы сможете прослушать их и получить сертификат по завершении.

  • Смогу ли я совмещать прохождение курса с работой или учебой?

    Да. Формат обучения специально построен так, чтобы вы могли совмещать прохождение курсов с работой или учебой, занимаясь в удобное для вас время.

  • Могу ли я смотреть курс в записи?

    Все материалы программы доступны в записи и размещены на электронной обучающей платформе, поэтому вы можете выстраивать график обучения самостоятельно. Вы можете пройти обучение в удобном для вас режиме.

  • Какая форма оплаты курса? Могу ли я оплатить курс частями?

    Да, вы можете оплатить весь курс сразу или частями. ИДО ТГУ предоставляет рассрочку оплаты за программы обучения, которая будет согласована и указана при оформлении договора.

  • Мне не пришло письмо со ссылкой на регистрацию после оплаты, что делать?

    Если вы не получили письмо после успешной оплаты, в первую очередь, проверьте, не ушло ли оно в папку спам. Если там ничего нет, свяжитесь с нами по номеру 8 (3822) 785-680.

  • У меня возникли проблемы при оплате курса, куда мне можно обратиться?

    Если возникли какие-либо трудности с оплатой, не переживайте и просто свяжитесь с нами — мы разберемся в проблеме и обязательно поможем! Для этого позвоните в наш колл-центр по номеру 8 (3822) 785-680.

  • Если мне не понравится, я смогу вернуть деньги?

    Да, если после начала курса вы решите, что он не подходит вам, вы сможете отказаться от обучения и получить деньги обратно за неиспользованную часть курса.

  • Здесь нет ответа на мой вопрос.

    Задайте ваш вопрос, позвонив в колл-центр по номеру 8 (3822) 785-680. Не стесняйтесь, мы всегда рады помочь!