CloudOps Engineer (41328)

« zpět
Ostrava
1/2026 (12m)
Kontrakt přes CP
60%
140 000 CZK

Hledám seniorního CloudOps Engineera, který pomůže provozovat a rozvíjet moderní SaaS platformu zaměřenou na data a umělou inteligenci. Budete mít odpovědnost za cloudový provoz v AWS, CI/CD pipeline i automatizaci infrastruktury a zároveň se stanete klíčovým partnerem pro AI/ML týmy při provozu GPU workloadů. Čeká Vás role s vysokým dopadem, kde se propojuje technická hloubka, provozní odpovědnost a práce s nejnovějšími technologiemi v oblasti cloudu a umělé inteligence.

🚀 Projekt
- správa vícevrstvé SaaS infrastruktury běžící v AWS (Fargate, EKS, EC2, S3, RDS, Lambda)
- návrh a provoz škálovatelných, dostupných a nákladově efektivních řešení pro aplikační i AI/ML workloady
- vedení incident response, post-mortem analýz a tvorba runbooků
- vlastnictví a rozvoj CI/CD pipeline pro aplikace i ML modely
- automatizace infrastruktury pomocí Infrastructure as Code (AWS CDK, Terraform)
- budování self-service nástrojů pro datové inženýry a AI týmy
- monitoring a optimalizace cloudových nákladů se zaměřením na compute, GPU a storage
- tvorba forecastů nákladů na AI a reportování úspor
- spolupráce s financemi a produktovým týmem na plnění nákladových cílů
- správa a automatizace ML pipeline (SageMaker, Kubeflow, MLflow)
- provoz GPU clusterů pro trénování a inferenci modelů
- zajištění škálování, observability a reprodukovatelného nasazení modelů
- nastavování monitoringu, alertingu, SLO/SLI a bezpečnostních politik
- příprava na audity a vedení dokumentace
- spolupráce napříč týmy a mentoring juniornějších kolegů

🎯 Skills
- 7+ let praxe v DevOps, CloudOps nebo SRE, ideálně na SaaS nebo datových platformách
- silná znalost AWS včetně EKS, Fargate, EC2, Lambda, RDS a CloudWatch
- zkušenosti s Kubernetes a kontejnerizací
- praxe s CI/CD nástroji ArgoCD, GitHub Actions a Jenkins
- skriptování v Pythonu, Bashi a TypeScriptu
- provoz AI/ML platforem jako SageMaker, Kubeflow nebo MLflow
- zkušenosti s GPU workloady a optimalizací výkonu i nákladů
- znalost FinOps principů včetně right-sizingu a predikcí nákladů
- orientace v observability nástrojích Splunk, Grafana a OpenTelemetry

💡 Nice to have
- pokročilá znalost AWS CDK a nástroje Projen
- zkušenosti s Helm charts a Kubernetes manifesty
- orientace v provozu multi-tenant SaaS platforem
- přehled o bezpečnostních rámcích SOC 2, HIPAA, ISO nebo NIST
- zkušenosti s AI nástroji a frameworky

Mám zájem, kontaktujte mě

Podobné pozice