📍 Local Job Near You

AI Architect (Runtime & Inference) - LLM Platforms | Specialist (Remote)

🏢

Compass UOL

📍 Remote, Brazil

📍

Location Remote

📅

Posted May 29, 2026

🚗

Commute Local Area

🎯

Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

Responsabilidades e atribuições Operar, otimizar e evoluir o runtime de agentes e a infraestrutura de inferência de LLMs em produção; 
Definir e implementar arquitetura de endpoints de modelo com foco em SLOs de latência e disponibilidade; 
Projetar e manter pipelines completos de observabilidade: métricas, logs estruturados, traces distribuídos e alertas inteligentes; 
Conduzir otimizações avançadas de performance: batching dinâmico, caching semântico, quantização e gestão de contexto; 
Liderar resposta a incidentes e análises de causa raiz em falhas do ambiente de inferência; 
Definir padrões de resiliência e estratégias de failover para workloads de LLM em produção; 
Produzir runbooks, playbooks e documentação operacional de referência para o ambiente; 
Requisitos e qualificações Habilidades Necessárias Expertise em operação de modelos de linguagem em produção com foco ...
                

Apply for This Job

Submit Application

Quick and secure application process

📍 Location Details

🌆

City

Remote

🗺️

Country

Brazil

🚗

Commute

Local Area

🔍 More Jobs Nearby

Explore other opportunities in Remote

View Local Jobs

AI Architect (Runtime & Inference) - LLM Platforms | Specialist (Remote)

📋 Job Description

Responsabilidades e atribuições

Requisitos e qualificações

Apply for This Job

📍 Location Details

🔍 More Jobs Nearby

📋
Job Description