Engenheiro de Dados Jr.
Hybrid · Sao Paulo, São Paulo, Federative Republic of Brazil
Job Summary
Engenheiro de Dados Jr. responsável pelo refinamento técnico de cards de dados, mapeando origens, regras de transformação e destinos antes do desenvolvimento. Desenvolver e manter pipelines ETL/ELT utilizando Python e SQL. Implementar estratégias de captura de dados: full load, incremental por timestamp e Change Data Capture (CDC). Construir e organizar dados nas camadas Raw + Trusted + Refined, respeitando contratos de dados e padrões de governança. Integrar fluxos à orquestração de pipelines (DAGs). Executar validações de qualidade de dados: volumetria, nulos e duplicidade antes do deploy. Documentar fluxos de dados, decisões de arquitetura e dependências de sistemas. SQL intermediário — modelagem, joins, filtros e agregações. Noções de arquitetura de dados em camadas (Data Lake / Data Warehouse). Noções de ETL e ELT — diferença conceitual e aplicação prática. Versionamento de código com Git e GitHub. Python básico para transformação de dados. Compreensão de estratégias de ingestão: full load vs. incremental. Familiaridade com orquestração de pipelines (Airflow, Prefect ou similares). Experiência com Apache Spark ou processamento distribuído. Conhecimento de CDC (Debezium, Kafka, ou similares). Familiaridade com metodologias ágeis (Kanban / Scrum) e gestão de tasks no Jira. Exposição a domínios financeiros (conciliação, investimentos, pagamentos).
Apply with one swipe on Sorce. We auto-fill applications and apply on your behalf — no cover letters, no 40-minute forms.
Hiring someone like this?
Get your role in front of qualified candidates on Sorce.