乐火资讯百科网欢迎您!
搜索
当前所在位置: 首页>财经要闻

5天用户破百万,ChatGPT背后有何玄机?

发布时间:2023-02-13 来源:java面试教材 点击:(3043) 【 字体:

OpenAI又火了!近期许多人的朋友圈里都混进了一个让人既爱又怕的狠角色,以至于StackOverflow不得不急忙下架。

近日,OpenAI发布了聊天AI ChatGPT,短短几天,其用户量直冲百万级,甚至服务器一度被注册用户挤爆了。

这种被网友惊叹“超越谷歌搜索”的神器究竟怎么做到的?到底靠谱吗?


事件回顾

OpenAI公司日前发布了ChatGPT,这是另一个基于旗舰GPT系列的大型语言模型(LLM),是一个专门用于对话交互的模型。用户可以下载该公司的免费演示版本。

与发布的大多数大型语言模型(LLM)一样,ChatGPT的发布也引发了一些争议。在发布之后的短短几个小时内,这个新的语言模型就在Twitter上引起了轰动,用户纷纷上传ChatGPT令人印象深刻的成就或者遭遇灾难性失败的截图。

然而,从大型语言模型的广泛角度来看,ChatGPT反映了该领域短暂而丰富的历史,代表了在短短几年内取得了多大的进展,以及还有哪些基本问题有待解决。


无监督学习的梦想

无监督学习仍然是人工智能社区追求的目标之一,而互联网上有大量宝贵的知识和信息。但直到最近,其中大部分的信息都无法用于机器学习系统。大多数机器学习和深度学习应用程序都是被监督的,这意味着人类必须采集大量数据样本并对每个样本进行注释,以训练机器学习系统。


随着Transformer架构(大型语言模型的关键组件)的出现,这种情况发生了变化。可以使用大量的无标记文本语料库来训练Transformer模型。它们随机屏蔽文本的部分,并试图预测缺失的部分。通过反复执行这一操作,Transformer调整其参数,以表示大序列中不同单词之间的关系。


这已被证明是一种非常有效和可扩展的策略。不需要人工标记,就可以收集非常大的训练语料库,从而允许创建和训练越来越大的Transformer模型。研究和实验表明,随着Transformer模型和大型语言模型(LLM)的规模增大,它们可以生成更长的连贯文本序列。大型语言模型(LLM)还展示了大规模的应急能力。


回归监督学习?

大型语言模型(LLM)通常只有文本,这意味着它们缺乏试图模仿的人类丰富的多感官体验。尽管GPT-3等大型语言模型(LLM)取得了令人印象深刻的成果,但它们存在一些基本缺陷,使得它们在需要常识、逻辑、规划、推理和其他知识的任务中无法预测,而这些知识通常在文本中被省略。大型语言模型(LLM)以产生幻觉反应、生成连贯但事实上虚假的文本以及经常误解用户提示的明显意图而闻名。


通过加大模型及其训练语料库的规模,科学家们已经能够减少大型语言模型中明显错误的频率。但根本的问题并没有消失,即使是最大的大型语言模型(LLM)也会在很小的推动下犯愚蠢的错误。


如果大型语言模型(LLM)只在科学研究实验室中用于跟踪基准测试的表现,这可能不会是一个大问题。然而,随着人们对在现实应用中使用大型语言模型(LLM)越来越感兴趣,解决这些问题和其他问题变得更加重要。工程师必须确保他们的机器学习模型在不同的条件下保持健壮,并满足用户的需求和要求。


为了解决这一问题,OpenAI使用了来自人类反馈强化学习(RLHF)技术,该技术此前开发用于优化强化学习模型。人类反馈强化学习(RLHF)不是让强化学习模型随机探索其环境和行为,而是使用来自人类主管的偶尔反馈来引导代理朝正确的方向前进。人类反馈的强化学习(RLHF)的好处是,它能够以极小的人为反馈改善强化学习代理的训练。


OpenAI后来将人类反馈强化学习(RLHF)应用于InstructGPT,这是一个大型语言模型(LLM)系列,旨在更好地理解和响应用户提示中的指令。InstructGPT是一个GPT-3模型,它根据人类反馈进行了微调。


这显然是一种权衡。人工注释可能成为可扩展训练过程中的瓶颈。但通过在无监督学习和有监督学习之间找到正确的平衡,OpenAI能够获得重要的好处,包括更好地响应指令、减少有害输出和资源优化。根据OpenAI的研究结果,13亿个参数的InstructionGPT在指令跟随方面通常优于1750亿个参数GPT-3模型。


ChatGPT的训练过程

ChatGPT建立在从InstructGPT模型中获得的经验之上。人工注释器创建一组示例对话,其中包括用户提示和模型响应。这些数据用于微调构建ChatGPT所基于的GPT-3.5模型。在下一步中,将为经过微调的模型提供新的提示,并为其提供若干响应。标注人员对这些反应进行排名。然后,从这些交互中生成的数据被用于训练奖励模型,这有助于在强化学习管道中进一步微调大型语言模型(LLM)。


OpenAI尚未披露强化学习过程的全部细节,但人们很想知道这个过程的“不可扩展的成本”,也就是需要多少人力。


能在多大程度上信任ChatGPT?


ChatGPT的结果令人印象深刻。该模型已经完成了各种各样的任务,包括提供代码反馈、写诗、用不同的音调解释技术概念、为生成人工智能模型生成提示。


然而,该模型也容易出现类似大型语言模型(LLM)所犯的那种错误,例如引用不存在的论文和书籍,误解直观的物理学,以及在组合性方面失败。


人们对这些失败并不感到惊讶。ChatGPT并没有发挥什么神奇的作用,它应该遇到与它的前一代同样的问题。然而,在现实世界的应用中,可以在哪里以及在多大程度上信任它?显然,这里有一些有价值的内容,正如人们在Codex和GitHubCopilot中所看到的,大型语言模型(LLM)可以被非常有效地使用。


在这里,决定ChatGPT是否有用的是与它一起实现的工具和保护的种类。例如,ChatGPT可能成为企业创建聊天机器人的一个非常好的平台,例如编码和图形设计的数字伴侣。首先,如果它遵循InstructGPT的示例,那么应该能够以更少的参数获得复杂模型的性能,这将使它具有成本效益。此外,如果OpenAI提供了工具,使企业能够实现自己的人类反馈强化学习(RLHF)的微调,那么它可以进一步针对特定应用程序进行优化,在大多数情况下,这比聊天机器人更有用,聊天机器人可以随意谈论任何事情。最后,如果为应用程序开发人员提供了将ChatGPT与应用程序场景集成,并将其输入和输出映射到特定应用程序事件和操作的工具,他们将能够设置正确的护栏,以防止模型采取不稳定的操作。


基本上,OpenAI创造了一个强大的人工智能工具,但具有明显的缺陷。它现在需要创建正确的开发工具生态系统,以确保产品团队能够利用ChatGPT的力量。GPT-3为许多不可预测的应用开辟了道路,因此了解ChatGPT的库存会很有趣。


猜你喜欢

车保险到期了第二年怎么交?

车保险到期了第二年怎么交?

当车辆保险到期后,如果您希望继续保持保险覆盖,您有几种选择:1、续保:联系您的保险提供商,并告知他们您希望继续保持保险覆盖。他们会···
2023-08-03
点击 19
不良资产5大处置方式

不良资产5大处置方式

不良资产是指银行或其他金融机构贷款借据、债券等长期债权类资产,由于借款人无力偿还或者其他原因,导致其价值受损或难以变现的资产。处置···
2023-08-03
点击 16
国家专项计划和地方专项计划的区别

国家专项计划和地方专项计划的区别

国家专项计划和地方专项计划是两种不同层级的计划,它们的区别主要在于执行的范围和资金来源。1、国家专项计划:国家专项计划是由中央政府···
2023-08-03
点击 8
数字人民币需要绑定银行卡吗?

数字人民币需要绑定银行卡吗?

数字人民币需要绑定银行卡吗?是的,数字人民币需要绑定银行卡。用户可以在银行或支付机构注册开通数字人民币钱包,然后将其与已有的银行卡···
2023-08-03
点击 9
车贷还清怎么查询?

车贷还清怎么查询?

车贷还清后,您可以通过以下步骤查询确认是否已经还清:1、联系贷款机构:最直接的方式是联系您的贷款机构,可以是银行、金融公司或汽车经···
2023-08-03
点击 18
第三者责任险200万和300万区别

第三者责任险200万和300万区别

第三者责任险是一种保险产品,旨在保护投保人对第三方因投保人的责任行为而造成的损失进行赔偿。200万和300万是保险责任限额,表示保···
2023-06-29
点击 10
相关推荐

关于车辆保养你应该了解的知识有什么

关于车辆保养你应该了解的知识有什么
在车辆的使用过程中,都会对车辆进行必要的保养,让自己的爱车始终处于最优的心能状态。但什么是首保、什么是大保、保养周期是什么、保养内容有哪些?今天我们就一起来了解以下。首次保养(常规保养) 首次保养,也称首保,保养内容与常规(基础)保养一致。汽车说明书上都在明显的位置注...

毕业祝福语篇15

毕业祝福语篇15
1、每个⼈⼼中都有⼀个梦想舞台,你⼼有多⼤,舞台就有多⼤。望你在以后道路上有⼀个宽阔的舞台。2、还记得么,我曾经很爱你们。后来的后来,明⽩与懂得,你们不曾对我⽤⼼过。3、再见学校,再见教室,再见⽼师,再见同学,再见我暗恋的⼥孩。4、海阔凭鱼跃,天⾼任鸟飞,祝你越飞越⾼哈。5、⽣活的海洋...

石家庄有哪些工艺品 石家庄特产特色收藏购买推荐

石家庄有哪些工艺品 石家庄特产特色收藏购买推荐
石家庄的工艺品有剪纸、藁城宫灯、紫铜浮雕、辛集皮毛、高粱秸秆工艺。1、剪纸无极剪纸主要以宣纸为原料,属单色剪纸。剪纸主要工具有剪刀和刻刀两种,因剪刀剪受工具和材料的限制,所以剪纸多用刀刻。刀刻剪纸还需要特制的石蜡或橡皮泥底版,制作工艺极其讲究。刻刀是一种特制的刀具,有长、尖、圆、方、三角、月牙等...

标致508中控按钮图解,标致508车内按键功能说明

标致508中控按钮图解,标致508车内按键功能说明
2022款标致508中控按钮图解及车内按键说明(一)驾驶辅助系统按钮①车道距离保持辅助开关(二)挡位区域按钮①电子手刹②模式切换(三)主驾驶车门按键①后视镜角度调节按钮②左右后视镜选择③车窗锁止按钮④车窗一键升降控制开关⑤中控锁按键(四)车顶按键①天窗滑动开关②天窗上掀开关③主驾驶阅读灯④副驾驶阅读灯...

腾讯“碳寻计划”启动,共同寻找下一代前沿低碳技术

腾讯“碳寻计划”启动,共同寻找下一代前沿低碳技术
  3月23日,一项旨在连接创新技术研发方和产业力量,推动前沿 CCUS技术走向规模化应用的“碳寻计划”正式在京启动。该计划由腾讯联合产业伙伴、投资伙伴和生态伙伴共同发起。计划将聚焦下一代前沿的CCUS技术,通过灵活的催化性资本,公开征集创新技术的项目方案,打造有示范性作用的落地项目,孵化有正向经济性潜能的初创...

5G“扬帆”赋能长三角智能航运

5G“扬帆”赋能长三角智能航运
图为近日拍摄的首艘国产大型邮轮“爱达·魔都号”。 新华社记者 丁汀 摄  5G融合应用大力推动了经济社会的数字化、网络化、智能化转型。随着5G网络深度覆盖与融通发展,上海5G融合应用“扬帆远航”的局面初步形成。记者了解到,近日,上海启动联合行动计划推动5G赋能长三角智能航运。利用5G技术为智能航运赋能,上海将实现...

推荐白城春季赏花好去处 白城市春季赏花去哪里

推荐白城春季赏花好去处 白城市春季赏花去哪里
白城市春季赏花可以去包拉温都杏树林、向海湿地这两个地方。白城市,是吉林省所辖地级市,位于吉林省西北部、嫩江平原西部。白城气候四季分明,冬长夏短,降水集中在夏季,雨热同期。春季干燥多风,十年九春旱;夏季炎热多雨,雨热不均。推荐白城春季赏花好去处1、包拉温都杏树林包拉温都杏树林位于吉林省白...

永安有哪些特色小吃福建永安特产

永安有哪些特色小吃福建永安特产
永安的特色小吃有煨豆腐、果条筒、磨浆果、米冻峰、糍粑、客家捶圆、红糟醉香鸡、永安粿条、永安艾果。1、永安艾果永安艾果是福建永安的特色小吃,有着非常悠久的历史,选用艾草和大米为主要原料,采用 传统的制作方法制作而成,放入各种馅料,最后蒸熟,吃起来营养美味,各种味道都有,主打咸甜两种味道,能够去湿气,对男...

南通有哪些工艺品江苏南通特产

南通有哪些工艺品江苏南通特产
南通的工艺品有南通风筝、南通缂丝、南通蓝印花布、海安茧丝绸、通州红木雕刻、扎染、板鹞风筝。1、 通州红木雕刻通州红木雕刻是江苏南通的传统手工艺品,通州红木雕刻久负盛名,它讲究美术造型,具有结构精巧,木纹清晰,做工精致的特点。南通红木雕刻厂生产的“金爵”牌红木小件和红木家具,早在八十年代就被众多外商誉为...

茶卡盐湖旅游攻略

茶卡盐湖旅游攻略
茶卡盐湖被称为“天空之境”,漫步上面就像进入了一个空旷的镜面世界,很容易拍出非常有意境的照片,不少人来这里拍自己的倒影,每年去茶卡旅游的人也非常多,下面给大家分享一份茶卡盐湖旅游攻略,这份茶卡盐湖自由行攻略肯定是大家需要的。地理位置:海西蒙古族藏族自治州乌兰县109国道南侧开放时间:4月中旬-10月下旬:5...
返回顶部