Responsável pela coleta de dados e armazenamento, limpeza e pré-processamento dos dados, desenvolvimento e manutenção de pipelines e qualidade dos dados disponibilizados no sistema.
Conhecimento/Domínio Tecnologias SAS
Programação em SAS Base, SAS Macro e SAS Guide para manipulação de dados.
SAS/ACCESS para integração com bancos de dados.
Expertise em Databricks
Desenvolvimento de pipelines de dados no Databricks Lakehouse Platform.
Programação em PySpark e Spark SQL para processamento distribuído.
Otimização de clusters e jobs no Databricks Runtime.
Integração com Delta Lake para gestão de dados em formato aberto.
Linguagens de Programação e Bancos de Dados
SQL avançado para consultas e modelagem de dados.
Conhecimento em Python (Pandas, NumPy) para automação e análise.
Familiaridade com bancos de dados como PostgreSQL, SQL S...