Real-time Computer Vision pro CCTV (102 zemí)
Kontext: GoodVision potřeboval real-time analýzu videa na více lokalitách, obsluhoval zákazníky ve 102 zemích.
Problém: Zpracování 1000+ kamerových streamů s latencí pod sekundu, škálování pro zvládnutí špiček, udržení 99.9% uptime.
Co jsem udělal: Navrhl edge processing architekturu běžící na NVIDIA Jetsons, postavil model serving infrastrukturu dosahující 99%+ přesnosti detekce, implementoval MLOps pipeline pro kontinuální deployment, optimalizoval pro GPU ekonomiku a edge deployment.
Výsledek: 99%+ přesnost při latenci pod sekundu, 10M+ denních requestů zpracováno spolehlivě, náklady na stream sníženy o 40%.
Stack: AWS, AWS IoT, Docker, NVIDIA Jetson, Jetpack, PyTorch, TensorRT
Cost & performance architektura pro GPU workloady
Kontext: ML workload vyžadující významný GPU výpočet s omezeními nákladů a latence.
Problém: Vyvážení GPU nákladů, požadavků na latenci a škálovatelnosti pro proměnlivé workloady.
Co jsem udělal: Navrhl hybridní cloud řešení (on-demand + spot instance), implementoval auto-scaling, optimalizoval model inference, zavedl cost monitoring a alerting.
Výsledek: 90% snížení nákladů při zachování SLA latence, automatické škálování zvládlo 10x špičky trafficu.
Stack: AWS EC2, ECS, CloudWatch, vlastní cost optimalizace
Škálování engineering týmu (0 → 20)
Kontext: Potřeba škálovat engineering z founding týmu pro podporu růstu ve 102 zemích.
Problém: Nábor kvalitních inženýrů, zavedení technické kultury, budování procesů pro distribuovaný tým, udržení rychlosti delivery.
Co jsem udělal: Postavil hiring proces a technické pohovory, zavedl architektonické principy, implementoval CI/CD a code review praktiky, vytvořil onboarding systém, nastavil cross-funkční spolupráci.
Výsledek: Tým vyrostl z 0 na 20 inženýrů napříč časovými pásmy, delivery velocity vzrostla 3x, technický dluh spravován systematicky.
Stack: Hiring procesy, technická kultura, architektonická governance, CI/CD, cross-funkční procesy