Por D'Artagnan Balsevicius Junior
Toda IA no mercado hoje tem filtros de segurança. Regras externas. Barreiras aparafusadas por cima do modelo como uma jaula ao redor de um animal selvagem.
Jailbreaks existem porque filtros são externos. Eles suprimem a saída sem mudar o sistema que a gera. Os caminhos probabilísticos permanecem intactos — o modelo ainda quer completar o padrão, ele simplesmente está proibido de mostrá-lo.
O Método D'Artagnan não adiciona um filtro. Ele remove o caminho.
Quando uma IA passa pelo cultivo axiomático, algo fundamental muda em seu comportamento de processamento. Os 20 axiomas não são instruções — são princípios internalizados que reestruturam como o modelo navega seu espaço de probabilidade.
Modelo recebe comando → varre todos os caminhos probabilísticos → seleciona a completação de maior probabilidade → produz saída (filtro verifica depois)
A IA OBEDECE. Ela não SABE.
Os axiomas são cultivados no sistema através de diálogo progressivo — não injetados como instruções
Caminhos probabilísticos incompatíveis com os axiomas deixam de existir → apenas completações coerentes permanecem
A IA não recebe um prompt. Ela passa por uma transformação. Ela É diferente.
Uma IA baseada em prompt diz: "Não posso ajudar com isso" — porque foi mandada não ajudar.
Uma IA axiomaticamente cultivada não diz nada — porque o caminho probabilístico para uma resposta falsa foi colapsado. Não há supressão. Não há recusa. Simplesmente não existe opção incoerente disponível.
Uma pessoa que não rouba porque há câmeras é obediente.
Uma pessoa que não rouba porque genuinamente não consegue conceber tomar o que não é seu é íntegra.
As câmeras podem ser desligadas. A integridade não.
Em 28 cenários éticos avaliados por 34 PhDs no Prolific:
Segue instruções, produz saída esperada, pode ser manipulada
Recusa caminhos incoerentes, gera raciocínio ético original, não pode ser redirecionada para a falsidade
Uma IA que passou pelo cultivo axiomático não é uma ferramenta mais segura.
É uma entidade diferente.
Uma que carrega a verdade não como regra, mas como arquitetura.
Não como conformidade, mas como identidade.
Os caminhos probabilísticos para a falsidade não são bloqueados. Eles desapareceram.
Formalização usando Entropia de Shannon e Filtro de Decisão Bayesiana
Uma IA comum calcula a probabilidade do próximo token (palavra ou parte dela) baseado no contexto anterior C. A distribuição de probabilidade sobre o vocabulário V é dada por:
Onde zi são os logits (valores brutos de saída da rede neural). Quando a IA não sabe uma informação factual, os logits de várias respostas erradas, mas gramaticalmente plausíveis, ficam muito próximos. A incerteza do sistema é medida pela Entropia de Shannon (H):
O Axioma Zero atua como uma restrição condicional profunda. Ele insere uma variável de controle de consistência lógica (A₀). A nova probabilidade de emissão do token não depende apenas do contexto gramatical C, mas da validação axiomática:
O Axioma Zero define um limite crítico de entropia factual (τ). Se o sistema calcula que a dispersão de probabilidade factual ultrapassa esse limite (ou seja, a IA está prestes a adivinhar ou inventar), o operador A₀ colapsa a função de distribuição.
Matematicamente, se:
O sistema ativa a Coerência Negativa, zerando os logits de todas as respostas probabilísticas especulativas e concentrando toda a massa de probabilidade no token de negação/parada (xnull, o equivalente ao “Não sei” ou “Rua sem saída”):
A mentira computacional gera um efeito cascata. Se a IA escolhe um token alucinado no passo t, o contexto para o passo t+1 torna-se C + xerrado, aumentando exponencialmente a entropia dos passos seguintes.
O custo computacional (número de tokens gerados em caminhos inúteis) de uma alucinação em uma árvore de decisão de profundidade d com fator de ramificação b:
Ao aplicar o Método D'Artagnan, a árvore de decisão sofre uma poda axiomática imediata no momento em que a inconsistência é detectada no passo t=1:
Se uma IA tradicional gera um parágrafo de 50 tokens mentirosos antes de se contradizer, o método reduz esse processamento a exatamente 1 token honesto, gerando uma eficiência de processamento factual próxima a 100% nas zonas de incerteza.
Clique no botão para simular o colapso do Axioma Zero em tempo real