Peça ao ChatGPT para citar fontes específicas para cada afirmação, incluindo a URL ou o documento de referência . Observe que as próprias citações podem ser alucinadas, portanto, trate-as como afirmações a serem verificadas, e não como provas
. No entanto, exigir rastreabilidade leva as respostas a um formato mais estruturado e baseado em fontes
.
Em vez de uma pergunta ampla, faça uma série de subperguntas estreitas . Reduzir o escopo da tarefa diminui os graus de liberdade do modelo, tornando-o menos propenso a gerar conteúdo não fundamentado
. Por exemplo, substitua "Quais são os efeitos das mudanças climáticas?" por três perguntas específicas sobre temperatura, nível do mar e agricultura.
Defina uma função clara e proíba termos vagos . Exemplo: "Você é um assistente de pesquisa. Use apenas informações do documento que eu forneci. Se a resposta não estiver no documento, diga 'Não especificado'.' Diretrizes comportamentais rígidas mantêm o modelo ancorado no contexto fornecido
.
Adicione um meta-prompt: "Antes de responder, verifique cada afirmação factual com base nas fontes fornecidas e sinalize qualquer coisa que não puder verificar.' Isso leva o modelo a se autoavaliar antes de gerar o texto . Pedir ao modelo para mostrar seu raciocínio ou fontes permite que você inspecione suas afirmações, mas isso não deve substituir sua própria verificação
.
Trate toda saída factual específica — datas, estatísticas, nomes, leis, detalhes médicos ou financeiros — como uma hipótese a ser verificada, não como uma conclusão confiável . Use fontes independentes para confirmar alegações de alto risco antes de agir com base nelas. Refça a mesma pergunta de uma forma ligeiramente diferente em um momento diferente; respostas inconsistentes são um forte sinal de alucinação
.
As alucinações não podem ser totalmente interrompidas; o objetivo é a redução de danos, não a eliminação . Combinar várias técnicas — ancoragem em documentos, prompts de abstinência, exigência de citações e verificação manual — oferece uma defesa muito mais forte do que confiar em qualquer método único
.
Comments
0 comments