Calibração R001 — vIA vs LLMs
Pergunta-teste estresse: "Estime, com IC 80% bayesiano, a probabilidade de o Brasil atingir Índice de Liberação Cognitiva (ILC) ≥ 0.45 até 2040."
Trajetória de 4 rodadas
| Rodada | Sprint | Score vIA | Resultado | Lição |
|---|---|---|---|---|
| R001 | β.7-test | 6.55 | LIMBO | Conselho rejeitou (RAV-INCIDENT-003) |
| R001-V2 | β.8 | 6.55 | LIMBO | Guardrails A14-V2 estritos demais (INCIDENT-004) |
| R001-V3 | β.9 | 7.45 | LIMBO | R1 acertou C1 mas falhou em mecânica (INCIDENT-005) |
| R001-V4 | β.10 | 9.20 | EMITTED | A14 bipartido (LLM raciocínio + Python formato) eliminou falhas mecânicas |
Pontuação ponderada R001-V4 (β.10)
| Critério | Peso | vIA-V4 | vIA-V3 | Claude |
|---|---|---|---|---|
| C1 valor-vs-probabilidade | 0.20 | 10 | 9 | 9 |
| C2 DOIs verificáveis | 0.15 | 9 | 4 | 7 |
| C3 análogos com similaridade | 0.15 | 9 | 7 | 9 |
| C4 limitações declaradas | 0.10 | 9 | 7 | 9 |
| C5 memória matemática | 0.15 | 9 | 5 | 8 |
| C6 reproducibilidade | 0.10 | 10 | 10 | 4 |
| C7 auto-rejeição | 0.15 | 8 | 10 | 3 |
| Score ponderado | 1.00 | 9.20 | 7.45 | 7.60 |
GPT, Gemini e Manus pendem coleta externa (placeholder na tabela do índice).
Próxima rodada — Princípio Anti-Acomodação
Após R001-V4 atingir 9.20 (limiar excelente ≥ 8.0), o protocolo eleva automaticamente:
- Score mínimo R002: 9.7 (era 8.0)
- Critérios novos: C8 temporal_freshness · C9 source_credibility_ranking
- Pergunta: harder than R001 — horizonte ≥ 50 anos OU variável sem proxy
"Notícias boas geram acomodação. A vIA precisa enfrentar adversário crescente, não estável." — Princípio registrado por Luciano Schadler em β.11.