Serviços

Como eu costumo contribuir quando um time precisa entregar de verdade.

Meu melhor encaixe é ao lado de produto, dados e backend, conectando IA aplicada a sistemas estáveis, rollout e operação.

Entrar no ciclo de entrega

Melhor encaixe quando o time precisa de um engenheiro sênior dentro da entrega real, ajudando a definir arquitetura, APIs, avaliação e operação em vez de produzir estratégia abstrata.

  • Traduzir restrições institucionais em escopo técnico prático
  • Atuar entre produto, dados, backend e release
  • Manter a entrega conectada à adoção real e ao uso operacional

Desenhar sistemas de IA aplicada

Trabalho prático em retrieval, NLP, avaliação e fluxos com humano no circuito para sistemas que precisam funcionar além do demo.

  • Definir fronteiras de sistema para fluxos com LLM e ML
  • Transformar comportamento de modelo em APIs e ferramentas confiáveis
  • Explicitar falhas, feedback loops e tradeoffs de rollout

Modernizar a operação de modelos

Trabalho de plataforma e MLOps para equipes que já possuem modelos em movimento e precisam torná-los mais seguros, mais rápidos de atualizar e mais fáceis de manter.

  • Padronizar retreinamento, empacotamento e release
  • Melhorar rastreabilidade com MLflow, DVC e orquestração
  • Reduzir dependência de passos manuais e conhecimento tácito

Pipelines de inteligência documental

Implementação de pipelines de IA aplicada para transformar PDFs e documentos não estruturados em saídas estruturadas confiáveis para sistemas de produção.

  • Desenhar fluxos de RAG e extração para casos documentais
  • Converter metadados e texto de PDFs em registros estruturados com esquema
  • Conectar pipelines de recuperação a bases vetoriais e APIs de produção

Avaliação de LLMs em produção

Estrutura de qualidade e prontidão de release para equipes que precisam de confiança mensurável antes de publicar mudanças de prompts, modelos ou fluxos.

  • Construir pipelines de avaliação para monitorar alucinação e factualidade
  • Comparar versões com avaliações por ground truth e LLM-as-a-judge
  • Definir critérios práticos de qualidade para releases mais seguros

Orquestração e integração de agentes

Orquestração escalável para fluxos longos de IA, com workers em fila e fronteiras de serviço desenhadas para confiabilidade em produção.

  • Implementar orquestração com workers (Kafka) e serviços de API
  • Padronizar acesso a provedores de modelo com camadas LiteLLM
  • Integrar fluxos de IA a ambientes existentes de microserviços

Next step

A melhor prova continua sendo o trabalho entregue.

Se você quiser avaliar fit com rapidez, comece pelos estudos de caso. É ali que ficam visíveis o nível de ownership, arquitetura e critério de entrega.