[Job - 28995] Mid-Senior Data Developer (PySpark + AWS), Brazil
On-site · Campinas, São Paulo, Brazil
Job Summary
Engenheiro(a) de Dados focado(a) em integração e modelagem para construir e evoluir nosso data lake e camadas analíticas. Principais responsabilidades incluem projetar, implementar e manter pipelines de dados ponta a ponta (ELT/ETL) com foco em confiabilidade, reprocessamento e custo-eficiência; orquestrar cargas com Airflow (AWS) e funções serverless (AWS Lambda); modelar dados no Snowflake e desenvolver transformações no dbt; construir integrações e serviços em Python com FastAPI para expor/consumir dados; trabalhar com market data (histórico e distribuição) com ênfase em governança e qualidade; escrever SQL de alto desempenho; utilizar Pandas para tratamentos e prototipação; garantir observabilidade, segurança e documentação; e colaborar com equipes de negócios, analytics e produtos para definir SLAs e padrões de governança.
Required Qualifications
- Sólida experiência com SQL (otimização de queries, modelagem relacional e analítica)
- Experiência prática com Snowflake (warehousing, roles, tasks, performance, custos) e dbt (models, tests, sources, exposures)
- Experiência construindo pipelines de dados em Airflow (DAGs, sensores, retries, SLA) e AWS Lambda
- Conhecimento de Postgres (ingestão, replicação/CDC básica ou manutenção, rotinas)
- Vivência com Python para dados (Pandas) e desenvolvimento de APIs com FastAPI
- Prática em ELT/ETL orientado a batches, versionamento em Git e CI/CD (deploy seguro de pipelines/modelos dbt)
- Noções de segurança e governança de dados (controle de acesso, linhagem, documentação, dados sensíveis)
- Inglês técnico para leitura de documentação
Apply with one swipe on Sorce. We auto-fill applications and apply on your behalf — no cover letters, no 40-minute forms.
Hiring someone like this?
Get your role in front of qualified candidates on Sorce.