Projetar, desenvolver e manter pipelines de ETL/ELT para ingestão, transformação e integração de dados provenientes de múltiplas fontes, garantindo escalabilidade e eficiência operacional.
Estruturar, organizar e evoluir o Data Lake, definindo e mantendo camadas como raw, trusted e refined/gold, além de estabelecer padrões de versionamento e particionamento.
Realizar análises exploratórias e mineração de dados para identificar padrões, anomalias, inconsistências e oportunidades de melhoria na qualidade e disponibilidade das informações.
Assegurar qualidade, governança e linhagem dos dados, implementando validações, auditorias, monitoramento e boas práticas de catalogação e metadados.
Modelar estruturas de dados (schemas, tabelas, views e modelos analíticos) em bancos relacionais e ambientes de processamento distribuído, otimizando desempenho de consultas e cargas.