OpenAI 推出 GPT-4o 的微调功能,允许开发者根据特定应用需求定制模型,从而提升性能和准确性。开发者可以使用自定义数据集对模型进行微调,使其能够适应特定用例,调整响应结构,并遵循复杂的领域特定指令。
微调功能对所有付费使用层级的开发者开放,并且在9月23日之前提供免费训练Token。经过微调的 GPT-4o 模型在多个基准测试中表现出显著提升,例如 Cosine 的 Genie 在 SWE-bench 基准测试中取得了最先进的成绩。
详细内容:
- 微调功能上线: 开发者现在可以微调 GPT-4o 和 GPT-4o mini 模型,从而在多个领域(如编程和创意写作)中提升模型性能。微调使模型能够根据少量的训练数据集定制响应的结构和语气,或是遵循复杂的领域特定指令。
- 费用和访问权限: 微调的训练成本为每百万个Token $25,而推理成本为每百万个输入Token $3.75 和每百万个输出Token $15。每个组织每天可以免费获得 100万个训练Token。GPT-4o mini 微调也对所有付费层级的开发者开放,并在9月23日之前每天提供200万免费训练Token。
- 成功案例:
- Cosine 的 Genie: 这个由 Cosine 开发的 AI 软件工程助手,Genie 能够自动识别和解决错误,构建新功能,并在与用户协作时进行代码重构。通过精细调校的 GPT-4o 模型,Genie 在上周二宣布的新 SWE-bench Verified 基准上取得了 43.8%的 SOTA 分数。Genie 在 SWE-bench Full 上也保持了 30.08%的 SOTA 分数,超越了其之前的 19.27%的 SOTA 分数,成为该基准历史上最大的改进。
- Distyl: 作为财富 500 强公司的人工智能解决方案合作伙伴,最近在领先的文本到 SQL 基准 BIRD-SQL 中获得了第一名。Distyl 的微调 GPT-4o 在排行榜上的执行准确率达到了 71.83%,并在查询重构、意图分类、思维链和自我纠正等任务中表现出色,尤其在 SQL 生成方面表现尤为突出。
- 数据隐私和安全性: 微调后的模型完全由用户控制,用户对其业务数据的输入和输出拥有完整的所有权,确保数据不会被共享或用于训练其他模型。同时,OpenAI 实施了多层安全措施,确保微调后的模型不会被滥用,并持续监控模型的使用情况,以确保遵循使用政策。
SitePoint 社区论坛是在线开发社区和程序员设计师家园之一