User Story
Como engenheiro de dados,
Quero executar um backfill completo re-raspando toda a base de notícias,
Para que preenchamos lacunas na base, atualizemos conteúdos alterados e re-classifiquemos com o novo LLM.
Contexto
A base atual tem "buracos" — alguns órgãos não foram raspados durante períodos de falha do scraper, classificação temática existe apenas para os últimos 1-2 anos, e conteúdos podem ter mudado desde a raspagem original.
Critérios de Aceite
Dependências
- Depende de: data-platform#56 (classificador LLM pronto)
- Depende de: DAG de enriquecimento (nova issue)
Notas da Reunião (10/02)
- Execução lenta e controlada para não impactar sites fonte
User Story
Como engenheiro de dados,
Quero executar um backfill completo re-raspando toda a base de notícias,
Para que preenchamos lacunas na base, atualizemos conteúdos alterados e re-classifiquemos com o novo LLM.
Contexto
A base atual tem "buracos" — alguns órgãos não foram raspados durante períodos de falha do scraper, classificação temática existe apenas para os últimos 1-2 anos, e conteúdos podem ter mudado desde a raspagem original.
Critérios de Aceite
Dependências
Notas da Reunião (10/02)