Hledám zkušeného Data Engineera, který se orientuje v moderních datových platformách a má za sebou reálnou praxi s návrhem a vývojem datových pipeline. Očekávám velmi dobrou znalost Databricks, práce s Delta Lake, PySparkem a SQL, stejně jako zkušenost s orchestrací jobů v Airflow a využitím DBT. Kandidát by měl rozumět datové architektuře, kvalitě dat a jejich dohledatelnosti a být schopen převádět regulatorní i byznysové požadavky do technických řešení. Pokud máte silný hands-on přístup a chuť řešit komplexní datové výzvy, ozvěte se mi.
🚀 Projekt
- vývoj a údržba procesních a analytických datových produktů
- návrh konceptuálních datových modelů a integračních vzorů
- integrace procesních, stabilitních a genealogických dat napříč systémy ERA, Appian a MRL/MMD
- zajištění kvality dat, jejich lineage a spolehlivosti mezi propojenými platformami
- návrh a implementace datových pipeline pro regulatorní podklady
- spolupráce s regulatorními stakeholdery na zajištění přesnosti, úplnosti a dohledatelnosti dat
- virtualizace datových modelů do MRL data lake ve spolupráci s týmy MANTIS a SDC
- podpora digitální transformace a cloudových datových strategií
- návrh datové architektury postavené na principech Delta Lake medallion
- vedení aktivit datového modelování v nástrojích jako PowerDesigner
- role solution architekta pro datovou oblast v rámci ERA data product workstreamu
- převod byznysových požadavků do technických specifikací
- úzká spolupráce s product ownery, subject matter experty a engineering týmy
🎯 Skills
- minimálně 5 let relevantní praxe v oblasti data engineeringu
- vývoj datových pipeline na platformě Databricks a pomocí DBT
- orchestrace datových jobů v nástroji Airflow
- pokročilá znalost Databricks technologií (Delta Lake, Unity Catalog, DLT, PySpark, SQL Warehouse)
- praktická zkušenost s orchestrací Databricks jobů pomocí Airflow
- zkušenosti s DBT, PL/SQL a Pythonem
- znalost cloudových služeb AWS (S3, IAM roles, AWS Secrets)
- zkušenost s provozem Databricks v prostředí AWS
- silná orientace na moderní datové platformy a praktický hands-on přístup
- schopnost samostatné práce, řešení problémů a odpovědnost za dodaná řešení
- práce s GitHubem, GitHub Actions a CI/CD pipelines pro nasazování datových jobů
- AJ C1
💡 Nice to have
- zkušenost z farmaceutického prostředí
#LI-MB3