Robot
			
			Складчик
		- #1
 
[Нетология] Data Scientist: с нуля до middle [Алексей Кузьмин, Олег Булыгин]
- Ссылка на картинку
 
Чем занимается Data Scientist
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Новые знания сделают вас востребованным специалистом в Data Science
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
						Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
Новые знания сделают вас востребованным специалистом в Data Science
Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.
Обучение на курсе поможет вам:
- Перейти в профессию с высоким окладом, которая не устареет через 10 лет
 - Освоить ключевые технологии и опередить запрос рынка
 - Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
 
- Новичкам в Data Science
 - Разработчикам
 - Аналитикам
 
- Работать с SQL
 - Использовать Python и библиотеки
 - Проверять данные и определять проблемы
 - Обучать многослойные нейронные сети и строить модели машинного обучения
 - Применять математику в алгоритмах
 - Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
 
Спойлер: Программа курса:
1 ступень. Погружение
2 ступень. SQL, Python и Big Data
- Аналитическое мышление (Курсовой проект):
 
- Что такое аналитическое мышление
 - Откуда берутся данные
 - Введение в Google-таблицы
 - Продвинутая визуализация данных
 - Продвинутые Google-таблицы
 - Python как инструмент анализа данных
 - Основы статистики
 - Машинное обучение для жизни
 - Основы визуализации данных (Курсовой проект):
 
- Зачем нужна визуализация данных
 - Связи, потоки, процессы и карты
 - Инструменты, источники и предподготовка данных
 - Как рассказать историю с помощью данных
 - Основы статистики и способы сравнения метрик
 
3 ступень. Машинное обучение, Deep Learning и нейронные сети
- SQL и получение данных (Курсовой проект):
 
- Архитектура и структура баз данных (БД)
 - Функции SQL и их аналоги в pandas
 - Простые запросы, join`ы, агрегаты
 - Консоль (знакомство, основные операторы, утилита psql)
 - Базовые команды в SQL и встроеные аналитические функции
 - Архитектура и проектирование
 - Импорт и экспорт данных посредством SQL и ETL программ
 - Нормализация
 - Принципы работы с различными БД
 - Зависимости
 - Основные библиотеки для подключения к БД из Python
 - Подготовка и сдача итогового проекта
 - Аналитика больших данных (Курсовой проект):
 
- Что такое большие данные
 - Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
 - Монетизация больших данных
 - NoSQL-подход
 - Характеристики и источники данных
 - MapReduce-подход
 - Культура сбора данных
 - Введение в Hadoop
 - Основы реализации проектов больших данных. Кейс-стади
 - Практическое задание (лабораторная работа) по аналитике данных и его разбор
 - Python для анализа данных (Курсовой проект):
 
- Базовые типы данных и циклы
 - Базовые понятия статистики
 - Функции и классы
 - Случайные события. Случайные величины
 - Продвинутые типы данных: массивы, множества, словари
 - Логистическая регрессия и дискриминационный анализ
 - Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
 - Корреляция и корреляционный анализ
 - Визуализация в Python
 - Доверительные интервалы. Статистическая проверка гипотез
 - Математика для анализа данных (Курсовой проект):
 
- Линейная алгебра. Вектора
 - Производная функции нескольких аргументов
 - Линейная алгебра. Матрицы
 - Теория оптимизации
 - Продвинутая линейная алгебра
 - Теория вероятности. Дискретные и непрерывные случайные величины
 - Математический анализ. Производная
 - Центральная предельная теорема и закон больших чисел
 
4 ступень. Soft Skills и управление проектами
- Машинное обучение:
 
- Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
 - Оценка точности модели, переобучение, регуляризация
 - Классификация: логистическая регрессия и SVM
 - Проблема качества данных
 - Функции потерь и оптимизация
 - Работа с пропусками и переменными
 - Рекомендательные системы:
 
- Неперсонализированные рекомендательные системы
 - Collaborative Filtering
 - Сontent-based-рекомендации
 - Гибридные алгоритмы
 - Временные ряды:
 
- Знакомство с временными рядами
 - Сингулярный спектральный анализ
 - Элементарные методы анализа временных рядов
 - Случайные марковские процессы
 - Модели ARMA
 - Нейронные сети в анализе временных рядов
 - Модели авторегрессии условной гетероскедастичности
 - Поиск изменений во временном ряде
 - Нейронные сети:
 
- Введение в нейронные сети и библиотеку Keras
 - Введение в рекуррентные сети
 - Углубление в нейронные сети и библиотеку Keras
 - Автокодировщики
 - Введение в свёрточные нейронные сети
 - Введение в генеративно-состязательные сети
 - Компьютерное зрение:
 
- Выделение признаков и поиск похожих изображений
 - Задачи детекции и сегментации
 - Сегментация и детекция объектов
 - Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
 - Свёрточные нейронные сети
 - Порождающие модели
 - Обучение свёрточной сети на практике
 - Обработка естественного языка:
 
- Введение в автоматическую обработку текста
 - Тематическое моделирование
 - Структура слова. Морфология
 - Информационный поиск
 - Синтаксический анализ
 - Классификация в АОТ
 - Дистрибутивная семантика
 - Языковые модели
 - Извлечение ключевых слов
 - Извлечение информации
 - Словари. Подкрепление знаний
 - Deep Learning (Курсовой проект):
 
- Регрессия и персептрон
 - Внимание: Dense Attention и Beam search
 - Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
 - Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
 - Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
 - Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
 - Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
 - GAN'ы: дискриминатор, генератор, продвинутые архитектуры
 
- Менеджмент data-проектов:
 
- Требования в data-проектах
 - Разработка отчётов по исследованию
 - Методология ведения data-проектов
 - Сохранение результатов эксперимента
 - Эффективные коммуникации:
 
- Коммуникации: синхронизация картины мира
 - Эмоциональный интеллект в переговорах
 - Коммуникации: искусство убеждения и структура аргумента
 - Тренды в тестировании: за какими ресурсами следить
 - Эмоциональный интеллект в коммуникациях: этапы развития, распознавание и управление своими и чужими эмоциями
 - Резюме, сопроводительное письмо, портфолио
 - Взаимодействие в команде:
 
- Как укрепить свой авторитет и позиции на работе
 - Налаживание вертикальных и горизонтальных связей в коллективе
 - Коммуникации на удалёнке и деловая переписка
 - Публичные выступления:
 
- Как презентовать идею или отчёт
 - Подготовка презентации к публичному выступлению
 - Как начать получать удовольствие от выступлений и перестать их бояться
 - Финальный хакатон и Kaggle Competitions:
 
В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
Итоговый проект — реальный кейс от Dodo Brands
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
								Показать больше
					
			
			
											
												
													Зарегистрируйтесь
												
											, чтобы посмотреть скрытый контент.