谷歌推出“自我发现”框架,显著提升GPT-4等大型语言模型的推理能力
谷歌Deepmind与南加州大学的研究人员共同研发了一种名为“SELF-DISCOVER”的创新框架,该框架能够引导大型语言模型,如GPT-4等,自行探索和发现任务内在的推理结构。这一突破性的技术不仅结合了多个推理模块的优势,为每个任务定制独特的解决方案,而且在多个复杂推理基准测试中展现出卓越的性能提升。
SELF-DISCOVER框架的核心在于其能够引导大型语言模型根据一组给定的原子推理模块,自行选择、调整和组合这些模块,以形成一个针对特定任务的推理结构。这些原子推理模块包含了各种高层次的问题解决启发式,例如“逐步思考”和“分解为子任务”等。通过SELECT模块,模型能够根据任务示例,判断哪些模块对解决该任务至关重要,从而形成一个高效且精确的推理路径。
为了验证SELF-DISCOVER框架的有效性,研究人员在多个复杂推理基准测试上进行了评估,包括Big Bench Hard、Thinking for Doing和MATH等。与仅使用链式思维(CoT)的方法相比,SELF-DISCOVER在21个任务上取得了高达42%的性能提升。在社交智能体推理任务上,GPT-4的准确率达到了85%,比之前最好的方法提高了33%。这些结果充分证明了SELF-DISCOVER框架在提升大型语言模型推理能力方面的显著优势。
SELF-DISCOVER框架的推出,为大型语言模型的发展开辟了新的道路。它不仅提高了模型的推理准确性,还增强了模型对复杂任务的适应性和灵活性。未来,随着技术的不断进步和应用场景的不断拓展,SELF-DISCOVER框架有望在自然语言处理、机器学习等领域发挥更大的作用,为人类带来更智能、更高效的技术体验。
暂无评论...