首页 > Ai资讯 > Ai日报 > Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

Reflection Llama-3.1-70B 模型 可以在推理过程中发现自己的错误并进行自我修正

发布时间:2024年09月07日

全球最强的开源模型:Reflection 70B。它使用了一种名为“Reflection-Tuning 反思调优”的技术进行训练,该技术教会模型在推理过程中发现自己的错误并进行自我修正。Reflection 70B 在多个基准测试(MMLU、MATH、IFEval、GSM8K)上超越了顶级闭源模型(如 GPT-4o 和 Claude 3.5 Sonnet),并击败了 Llama 3.1 405B。

该模型通过将规划过程分离为独立步骤来提高链式思维(CoT)的效果,并保证输出简洁明了。此外,开发团队确保了数据的去污处理。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.

加入会员

加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。

如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息,了解智能工具的用法以及最新动态。