🔔 Get instant job alerts delivered to your inbox! Set up your first alert →
📍 Local Job Near You

AI Architect (Runtime & Inference) - LLM Platforms | Specialist (Remote)

🏢
Compass UOL
📍 Remote, Brazil
📍
Location Remote
📅
Posted May 29, 2026
🚗
Commute Local Area
🎯
Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

Responsabilidades e atribuições

  • Operar, otimizar e evoluir o runtime de agentes e a infraestrutura de inferência de LLMs em produção;
  • Definir e implementar arquitetura de endpoints de modelo com foco em SLOs de latência e disponibilidade;
  • Projetar e manter pipelines completos de observabilidade: métricas, logs estruturados, traces distribuídos e alertas inteligentes;
  • Conduzir otimizações avançadas de performance: batching dinâmico, caching semântico, quantização e gestão de contexto;
  • Liderar resposta a incidentes e análises de causa raiz em falhas do ambiente de inferência;
  • Definir padrões de resiliência e estratégias de failover para workloads de LLM em produção;
  • Produzir runbooks, playbooks e documentação operacional de referência para o ambiente;

Requisitos e qualificações

Habilidades Necessárias
  • Expertise em operação de modelos de linguagem em produção com foco ...

Apply for This Job

Submit Application

Quick and secure application process

📍 Location Details

🌆
City
Remote
🗺️
Country
Brazil
🚗
Commute
Local Area

🔍 More Jobs Nearby

Explore other opportunities in Remote

View Local Jobs