ChatGPT 与 text-davinci-003 模型

现在chatGPT还没有正式api, 访问chatGPT只能通过openai 的chatGPT网页进行。不通过网页的话openai当前也提供api支持访问GPT3的模型,其中与chatGPT最接近的是text-davinci-003。

因为chatGPT不对中国大陆用户开放,现在国内有不少号称可以代访问chatGPT的服务比如微信公众号或小程序。但我测试比较了一下,大多数实际连的是gpt3的模型比如text-davinci-003而不是真正的chatGPT.

text-davinci-003 是2022初openai推出的instructGPT(或者说GPT3.5)的一部分。chatGPT是在GPT3.5基础上对交互对话又有了进一步的优化。这两者的区别是什么呢?chatGPT自己的回答是这样的:

Openai的官方文档跟上面chatGPT说的略有不同。2022年 openai发表的论文“Training language models to follow instructions with human feedback”。介绍了如何通过一种利用人工反馈的训练方法使chatgpt更好理解用户意图,回答更准确,以及避免产生不健康或政治不正确的答案。这种新的方法叫做Reinforcement Learning from Human Feedback (RLHF) ,论文里有详细介绍。

但是实际用起来它们之间真有区别吗?我做了些试验。

小滔微信聊天机器人: 我业余时间写了个微信聊天机器人”小滔”,如果用:gpt 开头提问,那么小滔会直接连chatGPT网页自动回答。如果用:g3 开头提问,小滔会通过openai的api调用text-davinci-003 回答。下面是一些不同问题的问答:

1. 请写一篇笑狮子的爱情故事

chatGPT:

text-davinci-003:

2. 解释并重写sql

chatGPT:

text-davinci-003:

3. 编新闻稿

chatGPT:

text-davinci-003:

4. 制定夏威夷旅游计划

chatGPT

text-davinci-003:

5. 比较几种存储网络的利弊

chatGPT:

text-davinci-003:

从这些例子可以看出来,chatGPT的回答往往更准确,更详细也更贴近提问者的意图。另外在这里没能比较的是上下文相关性– chatGPT 能够比较好的跟踪并理解对话的上下文。而直接用text-davinci-model的话因为最大token数的限制比较难实现对话中对上下文的理解。

chatGPT已经这么强了,而微软的Bing搜索和Edge浏览器的copilot集成的据说是chatGPT的下一版本,据目前的测试消息比现在的chatGPT更加强大,这对多少人是紧张,又有多少人是期待呢?

About: mmpower

Software Architect & Soccer Fan 黑超白袜 = IT 民工 + 摇滚大叔


Leave a Reply

Your email address will not be published. Required fields are marked *