Publishing Details
About This Podcast
Explore Statistics
Recent Episodes
S2E1 Найдорожчі фейли дата-інженерів: Чому дані не пробачають DELETE
Що відрізняє джуніора від сеньйора? Сеньйор точно знає, скільки компанії коштував його останній факап. Починаємо другий сезон з найболючішого — реальних, дорогих і дуже життєвих помилок в Data…
S1E26 Data Engineering Testing: від unit-тестів до інтеграції з dbt
У цьому випуску ми говоримо про тестування в дата-інжинірингу. Які види тестів варто застосовувати — від unit- і інтеграційних до end-to-end і контрактних. Розбираємо, що саме тестують у світі даних:…
S1E25 Avro та Protobuf у Data Engineering: схеми для якісних даних
Щоб дані залишались узгодженими і зрозумілими, інженери даних використовують спеціальні формати опису схем. У цьому випуску ми розглянемо два найпопулярніших варіанти — Apache Avro та Google…
S1E24 Якість даних для Data Engineering: що міряти і як тримати SLA
Пояснюємо, що таке Data Quality (якість даних) і як її вимірювати без «води». Розберемо «погані дані» та бізнес-виміри (Descriptive, User-driven), технічні метрики…
S1E23 Data Orchestration: від cron до DAG — глибше за Airflow
Ми вже говорили про Airflow як приклад оркестратора. У цьому епізоді йдемо ширше й глибше: пояснюємо, що таке data orchestration, навіщо вона потрібна та як виглядає зріла оркестрація поза межами…
S1E22 SQL: Query, DDL vs DML та життєвий цикл запиту (Query Life Cycle)
У цьому епізоді просто й по суті: пояснюємо, що таке query (запит) у СУБД, чітко розводимо DDL vs DML(структура проти даних) і проходимо Query Life Cycle від парсера та оптимізатора до виконання…
S1E21 Steps of Dimensional Modeling: 4 кроки на прикладі оренди e-самокатів
У 21-му випуску ми покроково проведемо вас крізь процес Dimensional Modeling за методологією Кімбалла. На прикладі компанії з оренди електросамокатів ви дізнаєтеся:Select the business process – чому…
Dimensional Modeling: OLTP vs OLAP, освоюємо Kimball’s Star Schema (Зіркова схема Кімбела) та Slowly Changing Dimension (SCD, повільно змінювана розмірність)
У цьому випуску ми просто й зрозуміло розкажемо:OLTP vs OLAP: навіщо потрібні окремі оперативні й аналітичні бази даних.Star Schema by Kimball: як факти (fact table) у центрі та виміри (dimension…
S1E19 Вступ до Data Modeling: Як перетворити бізнес-вимоги на таблиці
У цьому випуску — introduction to data modeling для data engineers. Розбираємо три рівні моделювання: conceptual, logical та physical. Пояснюємо, що таке granularity, normalization, primary…
S1E18 Ingest with Python — pandas та PySpark у data pipelines
Цей випуск завершує серію про ingestion-методи. Говоримо про два популярних інструменти з Python-екосистеми — pandas та PySpark.Коли варто використовувати кожен? Як зчитувати, обробляти і…
S1E17 Real-Time Ingestion без магії — CDC та Streaming Explained (Kafka)
Real-time ingestion — це вже не розкіш, а норма. У цьому випуску розбираємо, як працює CDC (Change Data Capture), чим він відрізняється від Kafka, і які існують варіанти стримінгових платформ для…
S1E16 SFTP vs API vs Object Storage: Битва ingestion-методів
У цьому випуску — глибоке занурення у три архітектурно різні способи інжесту: від старої школи (SFTP) до REST API та сучасних data lake-підходів через object storage. Пояснюю на прикладах, коли…
S1E15 Push чи Pull: як обрати правильну стратегію для data ingestion
Push чи Pull? Розбираємось, як саме дані потрапляють у систему: хто ініціює передачу, як це впливає на швидкість, надійність і масштабування. Порівнюємо обидва підходи з реальними прикладами.
S1E14 Stream Ingestion — нова ера Data Ingestion
Stream ingestion — новий підхід до data ingestion у реальному часі. У цьому епізоді: різниця з batch, delivery semantics, обробка помилок і практичний приклад з Pub/Sub → BigQuery. Мінімум теорії,…
S1E13 Data Ingestion по-старому: батч, snapshot і BigQuery
Batch ingestion — це класика data ingestion. Пояснюємо, як працює завантаження даних пачками: по часу чи обсягу, snapshot чи інкрементально. І показуємо практичний приклад з BigQuery та біткоїном.
S1E12 Принципи хорошої Cloud Data Architecture
Побудувати щось у хмарі може кожен. Побудувати так, щоб воно було надійне, гнучке, дешеве і безпечне — вже інше питання. У цьому випуску говоримо про 5 ключових принципів Cloud Data Architecture, які…
S1E11 Весь ІТ у трьох літерах: розбираємо IaaS, PaaS, SaaS
IaaS, PaaS і SaaS — не просто модні слова. Це різні способи використовувати хмару. Розбираємось, що вони значать, які є приклади, і як зрозуміти, що підійде саме тобі.
S1E10 Cloud Data Architecture простими словами
Після оркестраторів переходимо до великої картини: як виглядає сучасна хмарна архітектура для даних. Пояснюємо, що таке Lambda, Kappa та Medallion — простими словами, з прикладами з життя. Якщо хочеш…
S1E9 Prefect, Dagster, Mage: чим вони кращі (або простіші) за Airflow?
Airflow — це круто, але іноді занадто важко. У цьому випуску розбираємо, які ще інструменти керують пайплайнами: що обрати, якщо ти тільки починаєш, чим різняться стилі, і де Mage кращий за Airflow.…
S1E8 Airflow не магія. Це просто — якщо знаєш, що таке DAG
Airflow звучить як щось складне? Насправді все простіше, ніж здається. У цьому випуску пояснюємо, що таке DAG, чому саме на ньому тримається оркестрація, і як Airflow допомагає не втратити контроль,…
Frequently Asked Questions
Data Engineering від А до Я has published 27 episodes since May 2025, covering topics in Courses, Education.
Data Engineering від А до Я is currently declining with new episodes weekly. Average episode length is 7m.
Similar Podcasts
ЗНО/НМТ з історії України
DanylivZNO з історії України
24 episodes
Так склалася гістарычна
Ганна Дзягель
96 episodes
Християни для України
Christians for Ukraine
91 episodes
Так склалася гістарычна
Ганна Дзягель
95 episodes
"Біологія поведінки людини" Роберт Сапольскі
Хмаринка Media Group
25 episodes
Вчися вухами | Секс-освіта
Вчися вухами
20 episodes