0Корзина
Главная » Программирование » Евгений Ермаков, Валерий Соколов / Karpov.Courses - Инженер данных. Все части

Евгений Ермаков, Валерий Соколов / Karpov.Courses - Инженер данных. Все части

10 б Облако Mail 17.3 ГБ
490 P
Артикул: 3637
В наличии
Автор курса: Евгений Ермаков, Валерий Соколов Категория: Программирование Дата выхода: 2023 Продажник от автора: Перейти Цена у автора: 92000 P

Описание

НАУЧИТЕСЬ ПРАВИЛЬНО ГОТОВИТЬ ДАННЫЕ ЛЮБЫХ РАЗМЕРОВ И СЛОЖНОСТИ
Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.

ДЛЯ КОГО ЭТОТ КУРС:

ИНЖЕНЕР ДАННЫХ
Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.

АНАЛИТИК ДАННЫХ
Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.

BI-РАЗРАБОТЧИК
Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.

BACKEND-РАЗРАБОТЧИК
Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.
РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ
— Изучайте архитектуру хранилищ данных и подходы к их проектированию
— Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
— Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow

ПРОГРАММА КУРСА:

1. РЕЛЯЦИОННЫЕ И MPP СУБД
Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.

2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.

3. BIG DATA
Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.

4. ПРОЕКТИРОВАНИЕ DWH
Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.

5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.

6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.

7. BIG ML
Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.

8. УПРАВЛЕНИЕ МОДЕЛЯМИ
В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.

9. УПРАВЛЕНИЕ ДАННЫМИ
На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.

Вы находитесь на странице товара «Евгений Ермаков, Валерий Соколов / Karpov.Courses - Инженер данных. Все части», это материал 2023 года, который, мы надеемся, принесет вам пользу. Все курсы доступны по очень низкой цене, в отличии от оригинальной цены автора в размере 92000 рублей. Вы же получаете этот курс, купив в нашем магазине Coursx.net, с огромной скидкой, всего 490 рублей. На каждый курс Вы можете посмотреть оригинальный продажник, после чего принять решение о покупке. Обучающий курс входит в рубрику «Программирование», спросом которой пользуется множество покупателей. В нашем магазине Вы найдёте ещё много курсов от автора «Евгений Ермаков, Валерий Соколов», достаточно ввести в поиск имя автора.
Показать полностью
✅ После оплаты система мгновенно направит на вашу почту ссылку(и) на курс, регистрация необязательна!

🛑 Авторизуйтесь или зарегистрируйтесь и Вы получите ссылку не только на почту, но и на странице товара.
📲 Наши отзывы на сайте | в Telegram (кликабельно)

🤔 Есть сомнения в инфопродукте? В качестве гарантии можем отправить дополнительные скриншоты, любой видео файл или сделать запись с экрана содержимого на облаке.

🔆 Нашли дешевле в другом месте? Сделаем цену ещё ниже чем там где вы нашли!

✍🏻 По всем вопросам, в том числе с оплатой и получением - писать в Telegram (кликабельно), в чат на сайте (в нижнем правом углу) или на почту admin@coursx.net Мы всегда на связи!

Поделиться страницей

Часто задаваемые вопросы

Как приобрести инфопродукт? Почему такая низкая цена? Какие у меня гарантии? С каких стран можно оплатить? На какое время выдается доступ? Возможен ли возврат средств за купленный товар?

Другие инфопродукты

Быстрая доставка

Гарантируем быструю доставку заказа на ваш Email.

Лучшие цены

Гарантируем самые низкие цены. Сделаем цену ниже если нашли дешевле.

Прием заказов 24/7

Заказы принимаются круглосуточно!

100% Безопасная оплата

Безопасная оплата и получение заказа.