每天免费100万token,GPT-4o新增微调功能
OpenAI向所有开发者推出GPT-4o数据微调功能,可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。
例如,韩国最大电信运营商SK Telecom通过OpenAI的数据微调功能,打造了特定的AI助手,使对话总结准确率提高了35%,意图识别率提升了33%,客户满意度大幅度提升。
同时OpenAI宣布从今天到9月23日,每天免费提供100万token微调额度,推理成本每100万token输入3.75美元,每100万token输出15美元。
什么是数据微调
通常大模型是在超大规模数据上进行预训练的,以学习通用的语言知识和输出模式。由于数据过于杂乱,模型可能在金融、法律、医疗等业务中的表现并不理想,因为没有针对特定领域进行专门优化。
而数据微调可以将与特定任务或领域相关的新数据融合到模型中,并使用这些数据来调整模型的参数,使模型能够更好地理解和处理这些特定的数据。
在微调过程中,将收集到的特定任务数据输入到预训练模型中,然后通过反向传播、梯度下降、监督学习等技术,调整模型的参数使其在特定任务上的表现优化,模型会逐步学会识别和处理特定任务的数据模式。
例如,GPT-4o模型只能生成一般性的宽泛文本,但我们想要将其应用于情感分析领域,以判断文本的情感倾向是积极、消极还是中性。
我们就可以收集大量带有情感标注的文本数据,并使用这些数据对模型进行微调。在微调过程中,模型可以更好地学习如何根据文本中的词汇、语法和语义信息来判断情感倾向。
实际微调案例
Genie是上周 AI Agent代码领域杀出的一匹大黑马,其性能超过了同类的Devin、Amazon Q、Swe-agent+GPT-4等,而该产品便是基于Genie自有数据在GPT-4o上微调而成。
Genie能够实现跨复杂平台端到端的进行推理,能够像人类那样来修改和检测代码。在GPT-4o的帮助下,Genie 在OpenAI新发布的SWE-bench Verified 基准测试中实现了43.8% SOTA得分。还在 SWE-bench Full 基准测试中取得了30.08% 的得分,也是目前最高的评分。
Harvey是一家专门为律师提供类ChatGPT助手的服务商,为了更好的提升法律内容输出与准确率,使用了OpenAI的GPT-4进行数据微调。
在微调的过程中,他们使用了10亿token的数据,并对模型训练过程的每一步都进行了修改。最终,该AI助手的回答准确率提升了83%,使得律师们更喜欢这种微调的助手。
Distyl是一家为财富500强企业提供 AI 解决方案的合作伙伴,最近在 BIRD-SQL 基准测试中获得了第一名,这是领先的文本到 SQL 基准测试。
Distyl的微调 GPT-4o 模型在排行榜上实现了71.83% 的执行准确率,并在查询重构、意图分类、思维链和自我纠正等任务中表现出色,尤其是在 SQL 生成方面表现尤为突出。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【驴子肉的做法】驴肉是一种较为少见但营养丰富的肉类,具有高蛋白、低脂肪的特点,适合多种烹饪方式。以下是...浏览全文>>
-
【驴子的注音】在学习汉语拼音的过程中,很多初学者会遇到一些生僻字或不常见的词语,其中“驴子”就是一个常...浏览全文>>
-
【驴子的读音是什么】在日常生活中,我们经常会遇到一些汉字或词语,虽然看起来简单,但读音却容易让人混淆。...浏览全文>>
-
【驴子的词性%的词性是什么】在汉语中,词语的词性是指该词在句子中所扮演的语法角色,如名词、动词、形容词等...浏览全文>>
-
【驴友指点骑行西藏的流行路线】骑行西藏,是一场身体与心灵的双重挑战。对于热爱户外、追求自由的驴友来说,...浏览全文>>
-
【驴头的功效与作用】在传统中医和民间食疗文化中,驴头被认为具有一定的药用价值和营养价值。虽然现代医学对...浏览全文>>
-
【驴蹄子怎么做又脆又好吃】驴蹄子是一种传统食材,因其口感独特、营养丰富而受到许多人的喜爱。但很多人在制...浏览全文>>
-
【驴肉怎么做最好吃】驴肉是一种营养丰富、口感独特的肉类,因其脂肪含量低、蛋白质高而受到许多食客的喜爱。...浏览全文>>
-
【驴肉怎么做简单好吃】驴肉是一种营养丰富、口感细腻的肉类,但很多人对它的做法不太熟悉。其实,只要掌握一...浏览全文>>
-
【洛阳龙门站偏僻吗】洛阳龙门站是洛阳市重要的交通枢纽之一,位于洛阳市洛龙区,靠近著名的龙门石窟景区。许...浏览全文>>