Projetar, desenvolver e iterar prompts avançados, chains de raciocínio (multi‑step, agentic flows) e pipelines de geração orientados a casos de uso reais de negócio;
Definir, implementar e manter frameworks de avaliação de qualidade para sistemas baseados em LLMs, incluindo métricas automáticas e avaliações humanas;
Estabelecer guardrails técnicos e funcionais, como controle de escopo, formatos de resposta, validações semânticas e estratégias de fallback;
Projetar e aplicar estratégias de mitigação de alucinação, como grounding, uso de fontes confiáveis, checagem cruzada e validação pós‑geração;
Selecionar, comparar e otimizar o uso de modelos de linguagem (LLMs) conforme custo, latência, qualidade e requisitos de segurança;
Definir e documentar padrões de prompting, estilos de resposta e boas práticas para uso consistente dos modelos em múltiplos produtos;