Site Reliability Engineer (42071)
Přidejte se k týmu jako Site Reliability Engineer. Vaším úkolem bude implementace osvědčených postupů pro vysokou dostupnost, spolehlivost a škálovatelnost systémů, aktivní zlepšování existující infrastruktury a podílení se na inovacích. Požaduji zkušenosti s Terraform, GitHub Actions a GitOps, znalost SaaS architektury, Kubernetes včetně CLI, nastavování metrik, výstrah a tichých režimů. Kandidát by měl rozumět identifikaci SLI pro sladění s cíli dostupnosti a latence a mít zkušenosti s poskytováním infrastruktury v Azure.
🚀 Projekt
- specializace na klíčové systémy: operační systémy, úložné subsystémy, sledovatelnost (monitoring a logging), síťové technologie
- implementace osvědčených postupů pro vysokou dostupnost systémů, spolehlivost a odolnost proti chybám, škálovatelnost řešení
- aktivní účast na optimalizaci a zlepšování existujících systémů
- přispívání k inovacím a modernizaci infrastruktury
🎯 Skills
- znalost syntaxe Terraform a konfigurace GitHub Actions, včetně pipeline a správy úloh pomocí GitOps
- praktické znalosti konceptů a návrhů architektury SaaS
- porozumění Kubernetes, včetně používání CLI a opětovného poskytování služeb
- schopnost poskytovat a nastavovat metriky spolu se správou výstrah a tichých režimů
- identifikace indikátorů úrovně služeb (SLI), které sladí tým s cíli dostupnosti a latence
- pracovní zkušenosti a poskytováním infrastruktury v Azure
#LI-MT4