O mundo da inteligência artificial está em constante evolução e um avanço recente na investigação de IA elevou as coisas a outro nível. Um novo artigo apresenta a “Reflexão”, um agente autónomo com memória dinâmica e capacidades de autorreflexão, permitindo que os modelos de IA aprendam com os seus próprios erros e melhorem ao longo do tempo. Este desenvolvimento confere aos modelos de IA capacidades de raciocínio semelhantes às humanas e promete um aumento significativo no desempenho.

O Que É a Reflexão e Por Que É Que É Significativa?
Uma das maiores fraquezas dos modelos de IA atuais é a sua incapacidade de aprender com os seus erros. A Reflexão resolve isto ao dar a um agente memória dinâmica e capacidades de autorreflexão, melhorando as suas capacidades de raciocínio, rastreio e escolha de ações específicas para a tarefa. Em termos simples, o modelo agora pode memorizar as ações que realizou, rever essas ações e corrigir os seus erros.
O mais interessante desta abordagem é que não se limita a modelos GPT-4; pode funcionar com qualquer modelo de linguagem grande sem necessidade de ajuste fino. O modelo de reflexão simplesmente avalia a função de recompensa e atualiza a ação que precisa ser tomada pelo modelo de linguagem grande original, proporcionando um grande aumento no desempenho.
O Artigo Original Sobre a Reflexão
O artigo original sobre a reflexão apresenta resultados em dois conjuntos de dados diferentes, demonstrando a sua capacidade de raciocínio:
- Hotpot QA: Um conjunto de dados para perguntas e respostas diversas, explicáveis e com múltiplos saltos, que exigem que o modelo de linguagem raciocine através de vários documentos.
- ELF World: Alinhamento de texto e ambientes corporificados para aprendizagem interativa, combinando entradas e saídas de texto com o mundo físico, permitindo que o modelo interaja com o mundo físico usando instruções de texto.
Adicionar reflexão a estes modelos levou a melhorias de desempenho significativas, sem necessidade de ajuste fino.
Desmistificando Ideias Erradas Sobre o Artigo
Muitas pessoas acreditam erradamente que o artigo usa o GPT-4, mas na verdade usa o GPT-3 e 3.5 (ChatGPT). Esta distinção é significativa porque abre a possibilidade de combinar a reflexão com o Auto GPT, permitindo que os modelos de IA modifiquem tarefas em tempo real, proporcionando verdadeira inteligência.
Reflexão em Ação: Um Exemplo
Numa tarefa Hotpot QA, o modelo precisava de encontrar o nome de um ator mais conhecido por um papel numa série específica. Após uma tentativa inicial mal sucedida, o modelo usou a reflexão para identificar o erro na sua estratégia de pesquisa, corrigi-lo e, finalmente, encontrar a resposta correta. É exatamente assim que um humano abordaria um problema, refletindo sobre os seus erros e ajustando a sua estratégia em conformidade.
Limitações e Abordagem a Situações Sem Verdade Absoluta Definitiva
Uma grande limitação do artigo é que requer uma verdade absoluta para funcionar. No entanto, em muitas situações do mundo real, não existe uma verdade absoluta definitiva ou uma única solução ideal. Os autores do artigo propõem um método que espelha a resolução de problemas humana, criando um conjunto de testes interno com base na sua compreensão e, em seguida, ajustando as soluções até que satisfaçam a maioria dos testes.
Ao transferir o gargalo da precisão da geração correta de código sintático e semântico para a geração correta de testes sintáticos e semânticos, o modelo pode atingir taxas de precisão mais elevadas.
O Futuro da IA e da Reflexão
À medida que os modelos de IA com capacidades de reflexão se tornam mais generalizados, podemos esperar ver melhorias significativas no código gerado por IA e noutras tarefas complexas. Com a capacidade de melhorar iterativamente o seu próprio trabalho, os modelos de IA tornar-se-ão mais eficientes e eficazes na resolução de problemas e na geração de soluções.
É essencial para nós, como humanos, refletirmos sobre os desenvolvimentos que estamos a fazer na IA e considerarmos a direção que queremos tomar. Este avanço no raciocínio da IA é apenas o começo e não há dúvida de que mais avanços entusiasmantes virão.
Vídeo por Prompt Engineering
Referências:
- Artigo sobre a Reflexão: https://arxiv.org/pdf/2303.11366.pdf
- Blogue “Reflecting on Reflexion”: https://nanothoughts.substack.com/p/reflecting-on-reflexion
- Artigo HotpotQA: https://arxiv.org/pdf/1809.09600.pdf
- Artigo Alfworld: https://arxiv.org/pdf/2010.03768.pdf
- AutoGPT: https://github.com/Torantulino/Auto-GPT
- HumanEval: https://arxiv.org/pdf/2107.03374.pdf