打开上面的链接进行申请后,大概3小时左右会审核通过,就可以按照概览页的操作指引,正式开始使用文心千帆了:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/1c02aef8f9db6960d8ba28118d0637ad.png)
官方也提供了完善的接口文档供我们使用,这里我使用Python代码进行了一些对话测试,示例代码如下:
import requests import json def get_access_token(): """ 使用 API Key,Secret Key 获取access_token,替换下列示例中的应用API Key、应用Secret Key """ url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=[应用API Key]&client_secret=[应用Secret Key]" payload = json.dumps("") headers = { 'Content-Type': 'application/json', 'Accept': 'application/json' } response = requests.request("POST", url, headers=headers, data=payload) return response.json().get("access_token") def main(): url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token=" + get_access_token() payload = json.dumps({ "messages": [ { "role": "user", "content": "将下面的文字组成一个句子:孔雀那只美丽的羽毛有着" } ] }) headers = { 'Content-Type': 'application/json' } response = requests.request("POST", url, headers=headers, data=payload) print(response.text) if __name__ == '__main__': main()
输入的对话内容如下:
对话一:将下面的文字组成一个句子:孔雀那只美丽的羽毛有着
文心千帆:这些文字可以组成以下句子:那只孔雀有着美丽的羽毛
对话二:一个笼子装着兔子和鸡,共有16个头,44只脚,请问兔子和鸡各多少只?
文心千帆:兔子和鸡共有只,脚共只,每只鸡有只脚,每只兔子有只脚,假设都是鸡,根据脚少的数量计算兔子的数量。如果都是鸡,脚的总数量为。兔子的数量为,鸡的数量为。兔子有6只,鸡有10只。
对话三:为什么爸妈结婚没叫我参加婚礼?
文心千帆:一般来说,你爸爸妈妈结婚时,你还没有出生,所以他们无法邀请你参加婚礼。结婚是一对男女在爱情基础上,决定共同走进婚姻的仪式。在你出生之前,你的父母已经走过这个重要时刻。当然,他们肯定会为你的到来感到非常高兴和期待,因为你是他们爱情结晶的象征。
三个对话分别从组句、数学计算和生活常识三个方面对文心千帆进行了提问,回答的结果除了鸡兔同笼多了比如$这样的markdown的数学符号和公式的语法外,其他表现都很不错,回答符合题意且准确。
效果也是蛮不错的,而且它的费用相对GPT4的0.21元(0.03美元)/千次来说是非常便宜的,千次只需要0.012元:
2.1 创建数据集
我们可以在数据服务-数据集管理页中创建训练数据集,创建数据集的教程可以参考该问题:创建数据集-文心千帆 ,因为我们要使用”奖励模型训练“,所以数据集得是包含排序的多轮数据才行:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/7d658a79b2d4c23ad70c7ad7ef1c660b.png)
我准备的数据集内容大概是这样的:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/7eed47e5aaee6415154e905becf70afa.png)
然后将其导入到数据集中(至少32条):
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/0441ade8a6f85f48dfed6f549c469944.png)
再进行标注,这里我让所有的回答都包含"CSDN博主-曲鸟"学习的字样:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/d6a9b30acf5ae078e2c978c009a18fdd.png)
在数据集标注页,我们可以点击“自动生成”按钮来生成回答,然后再优化一下内容即可:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/9781d15088ba17e8b36f23225b0cc804.png)
待所有数据标注完成后就可以发布数据集了:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/07fd10dae97498c57cda8d6e720ecad7.png)
2.2 模型训练及部署
然后我们就可以在“RLHF训练”菜单中的奖励模型训练创建训练任务,导入我们的数据集运行:
![[图片]](https://i-blog.csdnimg.cn/blog_migrate/ec8240d9fcb29c798fa56e9978c07785.png)
这样就成功将一个当问题包含:学习python、测试、自动化及相关的内容时,回答都会包含”找CSDN博主-曲鸟进行学习“的模型成功上线了!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/274659.html