Data Engineering від А до Я

Data Engineering від А до Я

Data Enthusiast FM

Episodes 27
Avg. Duration 7m
Activity Declining
Since May 2025
Latest Episode Mar 2026

Publishing Details

Schedule
Weekly
Format
Episodic
Hosting
anchor.fm

About This Podcast

Що робить Data Engineer, чому без нього дані не працюють і як потрапити у професію? Цей подкаст — для тих, хто хоче розібратися в інженерії даних без зайвої термінології, з прикладами з життя, гумором і структурою. Пояснюємо, як працює сучасна команда даних, що таке ETL, пайплайни, хмара, архітектура — і чому це справді "нова золота жила в IT". Щотижня — новий епізод про важливе та цікаве в data engineering. Без нудьги, по суті.

Explore Statistics

Recent Episodes

S2E1 Найдорожчі фейли дата-інженерів: Чому дані не пробачають DELETE

Mar 03, 2026 12m

Що відрізняє джуніора від сеньйора? Сеньйор точно знає, скільки компанії коштував його останній факап. Починаємо другий сезон з найболючішого — реальних, дорогих і дуже життєвих помилок в Data…

S1E26 Data Engineering Testing: від unit-тестів до інтеграції з dbt

Sep 30, 2025 18m

У цьому випуску ми говоримо про тестування в дата-інжинірингу. Які види тестів варто застосовувати — від unit- і інтеграційних до end-to-end і контрактних. Розбираємо, що саме тестують у світі даних:…

S1E25 Avro та Protobuf у Data Engineering: схеми для якісних даних

Sep 16, 2025 20m

Щоб дані залишались узгодженими і зрозумілими, інженери даних використовують спеціальні формати опису схем. У цьому випуску ми розглянемо два найпопулярніших варіанти — Apache Avro та Google…

S1E24 Якість даних для Data Engineering: що міряти і як тримати SLA

Sep 01, 2025 12m

Пояснюємо, що таке Data Quality (якість даних) і як її вимірювати без «води». Розберемо «погані дані» та бізнес-виміри (Descriptive, User-driven), технічні метрики…

S1E23 Data Orchestration: від cron до DAG — глибше за Airflow

Aug 22, 2025 7m

Ми вже говорили про Airflow як приклад оркестратора. У цьому епізоді йдемо ширше й глибше: пояснюємо, що таке data orchestration, навіщо вона потрібна та як виглядає зріла оркестрація поза межами…

S1E22 SQL: Query, DDL vs DML та життєвий цикл запиту (Query Life Cycle)

Aug 11, 2025 6m

У цьому епізоді просто й по суті: пояснюємо, що таке query (запит) у СУБД, чітко розводимо DDL vs DML(структура проти даних) і проходимо Query Life Cycle від парсера та оптимізатора до виконання…

S1E21 Steps of Dimensional Modeling: 4 кроки на прикладі оренди e-самокатів

Aug 06, 2025 6m

У 21-му випуску ми покроково проведемо вас крізь процес Dimensional Modeling за методологією Кімбалла. На прикладі компанії з оренди електросамокатів ви дізнаєтеся:Select the business process – чому…

Dimensional Modeling: OLTP vs OLAP, освоюємо Kimball’s Star Schema (Зіркова схема Кімбела) та Slowly Changing Dimension (SCD, повільно змінювана розмірність)

Aug 01, 2025 10m

У цьому випуску ми просто й зрозуміло розкажемо:OLTP vs OLAP: навіщо потрібні окремі оперативні й аналітичні бази даних.Star Schema by Kimball: як факти (fact table) у центрі та виміри (dimension…

S1E19 Вступ до Data Modeling: Як перетворити бізнес-вимоги на таблиці

Jul 26, 2025 8m

У цьому випуску — introduction to data modeling для data engineers. Розбираємо три рівні моделювання: conceptual, logical та physical. Пояснюємо, що таке granularity, normalization, primary…

S1E18 Ingest with Python — pandas та PySpark у data pipelines

Jul 23, 2025 6m

Цей випуск завершує серію про ingestion-методи. Говоримо про два популярних інструменти з Python-екосистеми — pandas та PySpark.Коли варто використовувати кожен? Як зчитувати, обробляти і…

S1E17 Real-Time Ingestion без магії — CDC та Streaming Explained (Kafka)

Jul 22, 2025 6m

Real-time ingestion — це вже не розкіш, а норма. У цьому випуску розбираємо, як працює CDC (Change Data Capture), чим він відрізняється від Kafka, і які існують варіанти стримінгових платформ для…

S1E16 SFTP vs API vs Object Storage: Битва ingestion-методів

Jul 15, 2025 7m

У цьому випуску — глибоке занурення у три архітектурно різні способи інжесту: від старої школи (SFTP) до REST API та сучасних data lake-підходів через object storage. Пояснюю на прикладах, коли…

S1E15 Push чи Pull: як обрати правильну стратегію для data ingestion

Jul 15, 2025 7m

Push чи Pull? Розбираємось, як саме дані потрапляють у систему: хто ініціює передачу, як це впливає на швидкість, надійність і масштабування. Порівнюємо обидва підходи з реальними прикладами.

S1E14 Stream Ingestion — нова ера Data Ingestion

Jul 08, 2025 6m

Stream ingestion — новий підхід до data ingestion у реальному часі. У цьому епізоді: різниця з batch, delivery semantics, обробка помилок і практичний приклад з Pub/Sub → BigQuery. Мінімум теорії,…

S1E13 Data Ingestion по-старому: батч, snapshot і BigQuery

Jul 08, 2025 8m

Batch ingestion — це класика data ingestion. Пояснюємо, як працює завантаження даних пачками: по часу чи обсягу, snapshot чи інкрементально. І показуємо практичний приклад з BigQuery та біткоїном.

S1E12 Принципи хорошої Cloud Data Architecture

Jun 11, 2025 6m

Побудувати щось у хмарі може кожен. Побудувати так, щоб воно було надійне, гнучке, дешеве і безпечне — вже інше питання. У цьому випуску говоримо про 5 ключових принципів Cloud Data Architecture, які…

S1E11 Весь ІТ у трьох літерах: розбираємо IaaS, PaaS, SaaS

Jun 11, 2025 6m

IaaS, PaaS і SaaS — не просто модні слова. Це різні способи використовувати хмару. Розбираємось, що вони значать, які є приклади, і як зрозуміти, що підійде саме тобі.

S1E10 Cloud Data Architecture простими словами

Jun 08, 2025 8m

Після оркестраторів переходимо до великої картини: як виглядає сучасна хмарна архітектура для даних. Пояснюємо, що таке Lambda, Kappa та Medallion — простими словами, з прикладами з життя. Якщо хочеш…

S1E9 Prefect, Dagster, Mage: чим вони кращі (або простіші) за Airflow?

Jun 08, 2025 5m

Airflow — це круто, але іноді занадто важко. У цьому випуску розбираємо, які ще інструменти керують пайплайнами: що обрати, якщо ти тільки починаєш, чим різняться стилі, і де Mage кращий за Airflow.…

S1E8 Airflow не магія. Це просто — якщо знаєш, що таке DAG

Jun 06, 2025 5m

Airflow звучить як щось складне? Насправді все простіше, ніж здається. У цьому випуску пояснюємо, що таке DAG, чому саме на ньому тримається оркестрація, і як Airflow допомагає не втратити контроль,…

Frequently Asked Questions

How many episodes does Data Engineering від А до Я have?

Data Engineering від А до Я has published 27 episodes since May 2025, covering topics in Courses, Education.

Is Data Engineering від А до Я still active?

Data Engineering від А до Я is currently declining with new episodes weekly. Average episode length is 7m.

Similar Podcasts