Databrics Developer (42279)
Hledám Databricks Developera, který bude navrhovat, vyvíjet a optimalizovat datové pipeline nad velkoobjemovými daty. Budete se zaměřovat na výkon Spark jobů, správu Delta Lake a práci s daty v řádu terabajtů. Součástí role je i správa governance pomocí Unity Catalogu a optimalizace clusterů pro maximální efektivitu. Očekávám zkušenosti s Databricks a schopnost navrhovat škálovatelná datová řešení.
🚀 Projekt
- návrh, vývoj a optimalizace datových pipeline v prostředí Databricks nad velkoobjemovými daty
- ladění výkonu Spark jobů a práce s velkými datasetty
- správa dat v Delta Lake včetně práce s tabulkami o velikosti terabajtů
- správa přístupových práv a datové governance pomocí Unity Catalogu
- optimalizace nastavení clusterů a infrastruktury pro efektivní využití zdrojů a škálovatelnos
- spolupráce s datovým týmem na návrhu robustní a spolehlivé Lakehouse architektury
🎯 Skills
- min. 1 rok zkušeností s Unity Catalog včetně správy, governance a přístupových práv
- min. 2 roky zkušeností s Delta Lake včetně debuggingu a optimalizace velkých datových tabulek
- min. 2 roky zkušeností s optimalizací Spark pipeline na projektech s velkoobjemovými daty
- zkušenosti s laděním konfigurace clusterů v Databricks včetně autoscalingu a strategie využití zdrojů
💡 Nice to have
- znalost Databricks Asset Bundles nebo CI/CD integrace pro Databricks projekty
- zkušenosti s Delta Live Tables
- znalost Apache Iceberg nebo podobných open table formátů
- zkušenosti s datovou architekturou jako Medallion nebo Lakehouse
- znalost Azure prostředí včetně ADLS Gen2, ADF a Event Hubs
- zkušenosti s dbt pro transformační vrstvu
#LI-AH1