全球观速讯丨开发自己私有chatGPT(五)训练微调openai模型
微调
了解如何为应用程序自定义模型。
介绍
通过微调,您可以通过提供以下内容从通过 API 提供的模型中获得更多收益:
【资料图】
GPT-3 已经对来自开放互联网的大量文本进行了预训练。当给出一个只有几个例子的提示时,它通常可以直观地判断你正在尝试执行什么任务并生成一个合理的完成。这通常被称为“少镜头学习”。
微调通过训练比提示所能容纳的更多的示例来改进少数镜头学习,让您在大量任务上获得更好的结果。对模型进行微调后,无需再在提示中提供示例。这样可以节省成本并实现更低的延迟请求。
概括地说,微调涉及以下步骤:
准备和上传训练数据训练新的微调模型使用微调模型请访问我们的定价页面,详细了解如何对微调的模型训练和使用计费。
哪些模型可以微调?
微调目前仅适用于以下基本型号:davinci curie babbage ada text-davinci-003。
安装
我们建议使用我们的 OpenAI 命令行界面 (CLI)。要安装它,请运行
pip install --upgrade openai
(以下说明适用于版本0.9.4及更高版本。此外,OpenAI CLI 需要 python 3。
通过在 shell 初始化脚本(例如 .bashrc、zshrc 等)中添加以下行或在微调命令之前的命令行中运行它来设置环境变量:OPENAI_API_KEY
准备训练数据
训练数据是你教 GPT-3去说。
您的数据必须是JSONL文档,其中每行都是对应于训练示例的一对提示完成。您可以使用我们的CLI 数据准备工具轻松地将数据转换为此文件格式。
{"prompt": "", "completion": ""}{"prompt": "", "completion": ""}{"prompt": "", "completion": ""}...
CLI 数据准备工具
我们开发了一个工具来验证、提供建议和重新格式化您的数据:
openai tools fine_tunes.prepare_data -f
此工具接受不同的格式文件,唯一要求它们包含提示和完成列/键。您可以传递CSV、TSV、XLSX、JSON或JSONL文件,它会在指导您完成建议的更改过程后,将输出保存到 JSONL 文件中,以便进行微调。
创建微调模型
以下假设你已按照上述说明准备了训练数据。
使用 OpenAI CLI 启动微调作业:
openai api fine_tunes.create -t -m
BASE_MODEL是基础模型的名称(ada, babbage, curie, davinci)。您可以使用后缀参数自定义你的微调模型的名称。
运行上述命令会执行以下几项操作:
使用文件API 上传文件(或使用已上传的文件)创建微调作业流式传输事件,直到作业完成(这通常需要几分钟,但如果队列中有许多作业或数据集很大,则可能需要数小时)每个微调作业都从基础模型开始,默认是curie。模型的选择会影响模型的性能和运行微调模型的成本。
开始微调作业后,可能需要一些时间才能完成。你的作业可能排在我们系统上的其他作业后面,训练我们的模型可能需要几分钟或几小时,具体取决于模型和数据集大小。如果事件流因任何原因中断,您可以通过运行以下命令来恢复它:
openai api fine_tunes.follow -i
作业完成后,它会显示微调模型的名称。
除了创建微调作业之外,您还可以列出现有作业、检索作业状态或取消作业。
# List all created fine-tunesopenai api fine_tunes.list# Retrieve the state of a fine-tune. The resulting object includes# job status (which can be one of pending, running, succeeded, or failed)# and other informationopenai api fine_tunes.get -i # Cancel a jobopenai api fine_tunes.cancel -i
使用微调模型
OpenAI CLI:
openai api completions.create -m -p
curl
curl https://api.openai.com/v1/completions \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -H "Content-Type: application/json" \ -d "{"prompt": YOUR_PROMPT, "model": FINE_TUNED_MODEL}"
Python:
import openaiopenai.Completion.create( model=FINE_TUNED_MODEL, prompt=YOUR_PROMPT)
Node.js
const response = await openai.createCompletion({ model: FINE_TUNED_MODEL prompt: YOUR_PROMPT,});
标签:
- 全球观速讯丨开发自己私有chatGPT(五)训练微调openai模型
- 3月1日港股通数据:腾讯控股净买入额最大 理想汽车-W净卖出额居第一位
- 当前头条:dnf金币上限怎么弄12亿_dnf金币上限怎么弄8亿
- 公安机关深入开展“护校安园”行动
- 小小蚁国海岛玩法攻略_明朝风云兵部玩法攻略|全球热议
- 观焦点:受欺诈而订立的合同是无效合同还是可撤销合同
- 怎么拦截网站页面的广告_如何拦截网页广告?
- 看故事猜字谜及答案_读故事猜字谜 快看点
- 资讯:山东争创世界一流考古机构 加快建设考古博物馆
- 阿不思邓布利多是被谁杀死的_阿不思邓布利多扮演者死了吗
- 【天天播资讯】婚检有哪些项目_婚检
- 四川甘孜州泸定县发生4.8级左右地震 全球微头条
- 华测导航(300627.SZ):实控人赵延平完成减持533.69万股-全球今日报
- Serendipity完美解释_serendipity爱情解释-当前最新
- 北矿科技:人工智能领域公司尚无相关产品应用
- 每日精选:华兴源创:累计回购约68万股 占比0.1553%
- 一揽子交易和非一揽子交易的区别是什么
- 天天滚动:石头科技(688169):Q4经营稳中趋好 扣非业绩表现靓丽
- FED大幅加息预期升温金价承压 美黄金主力日线继续偏弱
- 东阳光药(01558.HK)涨超7%,截至发稿,涨7.54%,报8.13港元,成交额1667.53万港元 资讯推荐
- 舞蹈老年迪斯科广场舞_迪斯科广场舞
- 热门:08月25日晋中前往吉林出行防疫政策查询-从晋中出发到吉林的防疫政策
- 辽宁男篮主场门票今日开售
- 世界动态:一句话也没有说
- 住房租赁“金融17条”落地 业内:有助于培养商品房需求
- 天花板级风管机上市!美的星光科技版风管机带来舒适智生活
- 净利大增近150%!硅烷科技交出首份A股年度成绩单
- 2023宜昌城际公交807线路时刻表查询|通讯
- 上岛咖啡 乐群店
- 生命中不能承受之轻简介_生命中不可承受之轻 环球新消息