Data Scientist (42290)
Chcete se podílet na vývoji data science aplikací od návrhu až po produkční nasazení? Čeká vás práce s ETL pipelines, experimenty, modelováním i jejich vyhodnocováním. Využijete Python včetně OOP a knihovny jako pandas, SciPy nebo TensorFlow. Nezbytná je znalost statistického učení, SQL databází a verzování v Gitu. Cení se také schopnost rychle se učit a přístup zaměřený na řešení. Komunikace v AJ na úrovni C1 je nutností. Pokud navíc máte zkušenosti s produkčním kódem či cloudem, je to výhoda.
🚀 Projekt
- návrh, tvorba, testování a údržba portfolia data science aplikací ETL pipelines
- feature engineering
- design a vyhodnocování experimentů
- trénování a nasazování modelů
- monitorování výkonu v produkci
- psaní technické dokumentace
- Code reviews
🎯 Skills
- dobrá znalost pythonu včetně OOP
- znalost Data science knihovny (NumPy, pandas, SciPy, sklearn, lightGBM/XGBoost/CatBoost, torch/TensorFlow)
- zkušenost s modelováním dat a statistickým učením (regrese, klasifikace, validace)
- pracovní znalost Gitu
- znalost SQL databází
- schopnost a ochota učit se a současně dodávat řešení do produkce
- AJ C1
💡 Nice to have
- zkušenost s psaním produkčního kódu (unit testování, formátování kódu, potenciálně vývoj API)
- zkušenosti se Sparkem (Databricks) a Azure (Data Lake)
- předchozí praxe na podobné pozici
- VŠ vzdělání v oboru informatiky, ekonometrie nebo IT