Calibração R001 — vIA vs LLMs

Pergunta-teste estresse: "Estime, com IC 80% bayesiano, a probabilidade de o Brasil atingir Índice de Liberação Cognitiva (ILC) ≥ 0.45 até 2040."

Trajetória de 4 rodadas

Rodada	Sprint	Score vIA	Resultado	Lição
R001	β.7-test	6.55	LIMBO	Conselho rejeitou (RAV-INCIDENT-003)
R001-V2	β.8	6.55	LIMBO	Guardrails A14-V2 estritos demais (INCIDENT-004)
R001-V3	β.9	7.45	LIMBO	R1 acertou C1 mas falhou em mecânica (INCIDENT-005)
R001-V4	β.10	9.20	EMITTED	A14 bipartido (LLM raciocínio + Python formato) eliminou falhas mecânicas

Critério	Peso	vIA-V4	vIA-V3	Claude
C1 valor-vs-probabilidade	0.20	10	9	9
C2 DOIs verificáveis	0.15	9	4	7
C3 análogos com similaridade	0.15	9	7	9
C4 limitações declaradas	0.10	9	7	9
C5 memória matemática	0.15	9	5	8
C6 reproducibilidade	0.10	10	10	4
C7 auto-rejeição	0.15	8	10	3
Score ponderado	1.00	9.20	7.45	7.60

GPT, Gemini e Manus pendem coleta externa (placeholder na tabela do índice).

Após R001-V4 atingir 9.20 (limiar excelente ≥ 8.0), o protocolo eleva automaticamente:

"Notícias boas geram acomodação. A vIA precisa enfrentar adversário crescente, não estável." — Princípio registrado por Luciano Schadler em β.11.