JianYueZy · 免费提供绿色软件、活动线报以及其他网络资源,好货不私藏!

GPT-4学会“自我反思”:测试表现提升达30%

admin 值得一看 0 热度 352 收藏 0

早些时候,OpenAI正式对外展示了GPT-4多模态模型,展示了它相较此前GPT-3.5强大的性能。

但事实上,从近日放出的信息来看,GPT-4最为强大的并不是它诞生时的能力,而是它能够像人类一样自我反思”。

根据研究人员Noah Shinn和Ashwin Gopinath在论文中的表述,他们开发了一种新的技术,能够让AI模拟人类的自我反思,并评估自己的表现。

这使得GPT-4 在完成各种测试的时候,会增加一些额外的步骤,让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。

团队目前已经使用该技术对GPT-4进行了多种不同的性能测试。

在HumanEval测试中,GPT-4需要解决164个从未见过的Python编程问题,原本准确率为67%,使用反思技术后,准确率提升到了88%。

在 Alfworld测试中,GPT-4则需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务;使用反思技术后,AI的准确率从73% 提高到97%,只有4个任务失败。

总体来看,基于这一技术,GPT-4在高难度的测试中能够取得明显进步,提升达到了30%左右。

举报

免责声明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。敬请谅解!

评论列表
请自觉遵守互联网相关的政策法规,严禁发布广告、色情、暴力、反动的言论。
  • 点击我更换图片
  • 全部评论(0
    还没有评论,快来抢沙发吧!