OpenAI anuncia nova inteligência artificial que revisa erros no ChatGPT
Colaboração para Tilt, do Rio de Janeiro
03/07/2024 12h08
A OpenAI anunciou recentemente o desenvolvimento de um novo modelo de inteligência artificial chamado "CriticGPT", projetado para identificar falhas no código gerado pelo ChatGPT.
De acordo com a empresa, ao utilizarem essa ferramenta para revisar o código produzido, os usuários melhoram a precisão dos resultados em 60% dos casos.
Relacionadas
Com o tempo, esse recurso tecnológico se torna cada vez mais preciso, e seus erros mais difíceis de detectar. Essa dificuldade em identificar imprecisões motivou a criação do CriticGPT, que pode gerar "críticas" destacando erros nas respostas do chatbot que poderiam passar despercebidos pelos humanos".
O CriticGPT é baseado nos modelos GPT-4, desenvolvidos para aprender com o feedback humano por meio de um sistema conhecido como Reinforcement Learning from Human Feedback (RLHF). Essa tecnologia avalia as respostas do ChatGPT com base em comparações feitas por treinadores de IA.
Embora as sugestões do CriticGPT nem sempre sejam corretas, elas ajudam os treinadores a identificar um maior número de problemas nas respostas dos modelos.
A flexibilidade desse novo formato de IA permite sua adaptação para várias atividades de treinamento, além da revisão de códigos de programação.
Em testes, o novo modelo foi aplicado a um subconjunto de dados de treinamento do ChatGPT que haviam sido classificados como "perfeitos" pelos treinadores humanos. O novo modelo identificou erros e imprecisões em 24% desses casos, anteriormente considerados impecáveis.
No entanto, o CriticGPT ainda apresenta algumas limitações. Por exemplo, ele foi treinado com base em informações relativamente curtas geradas pelo ChatGPT, e não está claro como ele se sairá em tarefas mais extensas e complexas. Além disso, como qualquer inteligência artificial, ele também pode apresentar suas próprias falhas e até erros graves.
A OpenAI tem a intenção de adicionar o CriticGPT ao seu sistema de aprendizado por reforço orientado por feedback humano, com o objetivo de proporcionar suporte de IA aos seus treinadores e tornar mais fácil a avaliação dos resultados de serviços como o ChatGPT.