DE or DIE: Talks
Written by DE or DIE Follow us on Twitter!
#011 DataOps
20 September 2022
Механизмы DataOps What is DataOps? And How To Not Screw It Up, отличаются ли они от Data Governance. Мы обсудили практики работы с данными, нашли аналогии и различия с DevOps.
#010 Solving security problems with Data Mesh
07 September 2022
Обсудили статью Data Mesh / Data Product Security Pattern в которой Data Mesh рассматривается с новой стороны, как подход в котором удобно защищать данные и можно выстроить периметры data продуктов, а так же следить какие чувствительные данные кто из коллег запрашивает.
#009 State of Data Engineering 2022
06 July 2022
Ребята из lakeFS нарисовали красивую картинку про State of Data Engineering 2022, а мы её упомянули в дайджесте #20. С этой картинкой всё совсем непросто, так что там прямо есть что обсудить, а можно и что-то новое узнать!
#008 Replicated Log And Consensus
25 May 2022
Одна из самых сложных штук в распределённых системах — распределённый консенсус, кворум, консенсус и всё вокруг них. На удивление у нас нет общего видения того, как правильно и поэтому не только рассказываем, но и выясняем истину по ходу дела.
#007.5 Modern Data Stack
15 December 2021
Здесь мы обсуждаем статью How The Modern Data Stack Is Reshaping Data Engineering из дайджеста #15
#007 Future of Data Engineering
24 November 2021
Здесь мы обсуждаем статью The Future of the Data Engineer из дайджеста #14
Is the data engineer still the “worst seat at the table?” Thoughts on the past, present, and future of tooling, processes, and culture in our industry.
#006 Smartdata Edition
22 October 2021
Разговариаем про всякое — и про худи, и про DWH, и про DataLake, и про C# с LINQ'ом
#005 Why Not Airflow
29 September 2021
Здесь мы обсуждаем статью Why you should try something else than Airflow for data pipeline orchestration из дайджеста #12
#004 Lineage
01 September 2021
Здесь мы обсуждаем статью 4 Things You Need to Know When Solving for Data Quality из дайджеста #10
К нам присоединяется Сергей Ярымов, вместе с которым мы говорим про лайнэйдж, зачем он нежен, кто как его делает и, в частности, как его делает Slack.
В процессе выпуска всплыл тул sqlglot — парсер и транспайлер SQL, написанный на голом пайтоне.
#003 Qualified
07 August 2021
Здесь мы обсуждаем статью 4 Things You Need to Know When Solving for Data Quality из дайджеста #7
В целом обсуждаем TDD, тестирование данных и другие аспекты жизни дата инжинера, связанные с качеством
#002 Ever Changing
28 July 2021
По мотивам дайджеста #7
- Hudi, Iceberg and Delta Lake: Data Lake Table Formats Compared
- Apache Kafka Rebalance Protocol, or the magic behind your streams applications
- Big Data World, Part 4: Architecture
#001 Pilot
14 July 2021
Здесь мы обсуждаем статью и видео по мотивам недавно прошедшего Data Quality Meetup #4 из дайджеста #6
- Представляемся
- Разговариваем про тестирование пайплайнов
- Проблемы фейковых данных:
- Закономерности
- Правила генерации
- Опаздывающие данные
- Lineage
- Metadata Management
- SmartData
Older posts are available in the archive.