GUIA PRÁTICO · PT-BR · 30+ PÁGINAS

IA para Engenheiros
de Dados

Guia Prático com Claude Code

Do Medallion ao pipeline completo — em PT-BR, com 5 scripts prontos para usar

Comprar por R$59 →

Por Thais Vaz · Engenheira de Dados · Bradesco (30M transações/dia) · Apple via HCL (500M eventos/dia)

Você sabe usar PySpark. Sabe dbt. Sabe Medallion.
O problema é que você ainda gasta 70% do tempo em sintaxe
e 30% no que realmente importa.

Com Claude Code, inverte.

O que você recebe

30+ páginas de conteúdo prático

Sem teoria desnecessária. Direto ao que funciona no trabalho real.

5 scripts Python prontos

Comentados em PT-BR. Rodam com python script.py. Sem dependências extras.

Medallion Architecture com IA

Bronze → Silver → Gold com Claude Code. SCD Type 2 incluído.

PySpark com IA

Jobs de ingestão, otimização, logging JSON. Template completo.

dbt com IA

Geração de modelos, testes, data contracts. Script que lê SQL e gera dbt.

Pipeline completo em 1 semana

Do raw ao dashboard. Orquestração, qualidade de dados, CI/CD.

5 scripts que você vai realmente usar

01 01_medallion_setup.py

Cria estrutura Bronze/Silver/Gold e gera CLAUDE.md com template Medallion preenchido.

python 01_medallion_setup.py --projeto meu-datalake --fontes sap,crm,app
02 02_pyspark_ingestion.py

Template de ingestão Bronze com validação de schema, logging JSON e modo append.

python 02_pyspark_ingestion.py --source /data/raw/pedidos.csv --format csv
03 03_dbt_generator.py

Lê CREATE TABLE e gera modelo dbt + schema.yml com testes e descrições via LLM.

Requer ANTHROPIC_API_KEY (a sua).
04 04_pipeline_orchestrator.py

Orquestra Bronze → Silver → dbt com retry exponencial e checkpoint por step.

python 04_pipeline_orchestrator.py --date 2024-01-15 --steps bronze,silver,dbt
05 05_ai_data_quality.py

Analisa amostra da Gold, identifica anomalias via LLM, gera relatório em PT-BR.

Requer ANTHROPIC_API_KEY (a sua).

Baseado em experiência real

30M
transações/dia

Plataforma de fraude em tempo real com Kafka e Spark · Bradesco

500M
eventos/dia

Pipeline de métricas críticas em Hive e Presto · Apple via HCL

RAG
em produção

Sistema de crédito wholesale com LangChain e Databricks Vector Store · Bradesco

Mestrado em Métodos Numéricos em Engenharia · UFPR

Este guia é para você se…

  • Você já usa PySpark, dbt ou Spark no trabalho
  • Quer usar Claude Code mas não sabe por onde começar com dados
  • Está cansado de gastar horas em boilerplate que a IA poderia gerar
  • Quer scripts reais, não tutoriais de brinquedo
  • Trabalha com pipelines de dados no mundo real
  • Iniciantes em programação (este guia assume que você já programa)
  • Quem quer teoria sobre IA (aqui é prática)

Uma prévia do que você vai aprender

CAPÍTULO 2 — MEDALLION COM IA

A regra que funciona na prática: o agente estrutura, você valida.

Quando você pede ao agente para criar um job Silver, ele sabe o que é permitido (limpar, validar, padronizar) e o que não é (agregar, filtrar por regra de negócio sem documentação).

O agente não conhece o seu negócio. Não sabe que status = 'X' significa cancelamento por fraude na sua empresa. Essas coisas estão na sua cabeça. O agente só sabe o que você diz explicitamente no prompt.

Pronto para parar de escrever boilerplate?

30+ páginas · 5 scripts · PT-BR · Acesso vitalício

R$79 R$59 preço de lançamento
Comprar no Kiwify →

Sem garantia de resultado — mas o conteúdo é baseado em produção real.
Se o PDF não abrir, devolvo na hora.