Data Engineer (41914)
Hledám Data Engineera se silnou zkušeností s Python a PySpark pro návrh a rozvoj škálovatelných datových pipeline. Budete zpracovávat velké objemy dat v prostředí Databricks a podílet se na návrhu datové architektury. Čeká vás práce s distribuovanými frameworky a nasazení řešení v cloudovém nebo hybridním prostředí. Očekávám znalost SQL, datového modelování a zkušenost s Azure, GCP nebo AWS. Zaujala vás tato příležitost? Určitě se mi ozvěte.
🚀 Projekt
- návrh, vývoj a údržba škálovatelných datových pipeline
- zpracování a transformace velkých datových objemů pomocí PySpark
- práce s distribuovanými frameworky pro zpracování dat
- podíl na návrhu a optimalizaci datové architektury
- spolupráce s datovými analytiky, architekty a dalšími týmy
- zajištění kvality, výkonu a spolehlivosti dat
- podpora nasazení a monitoringu v cloudovém nebo hybridním prostředí
🎯 Skills
- silná praktická zkušenost s Python
- zkušenost s PySpark
- zkušenost s Databricks
- zkušenost s cloud platformami jako Azure, GCP nebo AWS
- zkušenost se zpracováním velkých objemů dat
- porozumění principům distribuovaného zpracování
- znalost SQL a datového modelování
- schopnost samostatné práce v agilním prostředí
- AJ B2
💡 Nice to have
- znalost CI CD pro datové pipeline
- zkušenost z prostředí finančních služeb
- znalost data governance a frameworků pro řízení kvality dat
#LI-MB4