乐火资讯百科网欢迎您!
搜索
当前所在位置: 首页>财经要闻

5天用户破百万,ChatGPT背后有何玄机?

发布时间:2023-02-13 来源:java面试教材 点击:(3067) 【 字体:

OpenAI又火了!近期许多人的朋友圈里都混进了一个让人既爱又怕的狠角色,以至于StackOverflow不得不急忙下架。

近日,OpenAI发布了聊天AI ChatGPT,短短几天,其用户量直冲百万级,甚至服务器一度被注册用户挤爆了。

这种被网友惊叹“超越谷歌搜索”的神器究竟怎么做到的?到底靠谱吗?


事件回顾

OpenAI公司日前发布了ChatGPT,这是另一个基于旗舰GPT系列的大型语言模型(LLM),是一个专门用于对话交互的模型。用户可以下载该公司的免费演示版本。

与发布的大多数大型语言模型(LLM)一样,ChatGPT的发布也引发了一些争议。在发布之后的短短几个小时内,这个新的语言模型就在Twitter上引起了轰动,用户纷纷上传ChatGPT令人印象深刻的成就或者遭遇灾难性失败的截图。

然而,从大型语言模型的广泛角度来看,ChatGPT反映了该领域短暂而丰富的历史,代表了在短短几年内取得了多大的进展,以及还有哪些基本问题有待解决。


无监督学习的梦想

无监督学习仍然是人工智能社区追求的目标之一,而互联网上有大量宝贵的知识和信息。但直到最近,其中大部分的信息都无法用于机器学习系统。大多数机器学习和深度学习应用程序都是被监督的,这意味着人类必须采集大量数据样本并对每个样本进行注释,以训练机器学习系统。


随着Transformer架构(大型语言模型的关键组件)的出现,这种情况发生了变化。可以使用大量的无标记文本语料库来训练Transformer模型。它们随机屏蔽文本的部分,并试图预测缺失的部分。通过反复执行这一操作,Transformer调整其参数,以表示大序列中不同单词之间的关系。


这已被证明是一种非常有效和可扩展的策略。不需要人工标记,就可以收集非常大的训练语料库,从而允许创建和训练越来越大的Transformer模型。研究和实验表明,随着Transformer模型和大型语言模型(LLM)的规模增大,它们可以生成更长的连贯文本序列。大型语言模型(LLM)还展示了大规模的应急能力。


回归监督学习?

大型语言模型(LLM)通常只有文本,这意味着它们缺乏试图模仿的人类丰富的多感官体验。尽管GPT-3等大型语言模型(LLM)取得了令人印象深刻的成果,但它们存在一些基本缺陷,使得它们在需要常识、逻辑、规划、推理和其他知识的任务中无法预测,而这些知识通常在文本中被省略。大型语言模型(LLM)以产生幻觉反应、生成连贯但事实上虚假的文本以及经常误解用户提示的明显意图而闻名。


通过加大模型及其训练语料库的规模,科学家们已经能够减少大型语言模型中明显错误的频率。但根本的问题并没有消失,即使是最大的大型语言模型(LLM)也会在很小的推动下犯愚蠢的错误。


如果大型语言模型(LLM)只在科学研究实验室中用于跟踪基准测试的表现,这可能不会是一个大问题。然而,随着人们对在现实应用中使用大型语言模型(LLM)越来越感兴趣,解决这些问题和其他问题变得更加重要。工程师必须确保他们的机器学习模型在不同的条件下保持健壮,并满足用户的需求和要求。


为了解决这一问题,OpenAI使用了来自人类反馈强化学习(RLHF)技术,该技术此前开发用于优化强化学习模型。人类反馈强化学习(RLHF)不是让强化学习模型随机探索其环境和行为,而是使用来自人类主管的偶尔反馈来引导代理朝正确的方向前进。人类反馈的强化学习(RLHF)的好处是,它能够以极小的人为反馈改善强化学习代理的训练。


OpenAI后来将人类反馈强化学习(RLHF)应用于InstructGPT,这是一个大型语言模型(LLM)系列,旨在更好地理解和响应用户提示中的指令。InstructGPT是一个GPT-3模型,它根据人类反馈进行了微调。


这显然是一种权衡。人工注释可能成为可扩展训练过程中的瓶颈。但通过在无监督学习和有监督学习之间找到正确的平衡,OpenAI能够获得重要的好处,包括更好地响应指令、减少有害输出和资源优化。根据OpenAI的研究结果,13亿个参数的InstructionGPT在指令跟随方面通常优于1750亿个参数GPT-3模型。


ChatGPT的训练过程

ChatGPT建立在从InstructGPT模型中获得的经验之上。人工注释器创建一组示例对话,其中包括用户提示和模型响应。这些数据用于微调构建ChatGPT所基于的GPT-3.5模型。在下一步中,将为经过微调的模型提供新的提示,并为其提供若干响应。标注人员对这些反应进行排名。然后,从这些交互中生成的数据被用于训练奖励模型,这有助于在强化学习管道中进一步微调大型语言模型(LLM)。


OpenAI尚未披露强化学习过程的全部细节,但人们很想知道这个过程的“不可扩展的成本”,也就是需要多少人力。


能在多大程度上信任ChatGPT?


ChatGPT的结果令人印象深刻。该模型已经完成了各种各样的任务,包括提供代码反馈、写诗、用不同的音调解释技术概念、为生成人工智能模型生成提示。


然而,该模型也容易出现类似大型语言模型(LLM)所犯的那种错误,例如引用不存在的论文和书籍,误解直观的物理学,以及在组合性方面失败。


人们对这些失败并不感到惊讶。ChatGPT并没有发挥什么神奇的作用,它应该遇到与它的前一代同样的问题。然而,在现实世界的应用中,可以在哪里以及在多大程度上信任它?显然,这里有一些有价值的内容,正如人们在Codex和GitHubCopilot中所看到的,大型语言模型(LLM)可以被非常有效地使用。


在这里,决定ChatGPT是否有用的是与它一起实现的工具和保护的种类。例如,ChatGPT可能成为企业创建聊天机器人的一个非常好的平台,例如编码和图形设计的数字伴侣。首先,如果它遵循InstructGPT的示例,那么应该能够以更少的参数获得复杂模型的性能,这将使它具有成本效益。此外,如果OpenAI提供了工具,使企业能够实现自己的人类反馈强化学习(RLHF)的微调,那么它可以进一步针对特定应用程序进行优化,在大多数情况下,这比聊天机器人更有用,聊天机器人可以随意谈论任何事情。最后,如果为应用程序开发人员提供了将ChatGPT与应用程序场景集成,并将其输入和输出映射到特定应用程序事件和操作的工具,他们将能够设置正确的护栏,以防止模型采取不稳定的操作。


基本上,OpenAI创造了一个强大的人工智能工具,但具有明显的缺陷。它现在需要创建正确的开发工具生态系统,以确保产品团队能够利用ChatGPT的力量。GPT-3为许多不可预测的应用开辟了道路,因此了解ChatGPT的库存会很有趣。


猜你喜欢

相关推荐

大学毕业后在家躺平怎么办 毕业后只想宅在家里怎么办

大学毕业后在家躺平怎么办 毕业后只想宅在家里怎么办
应该寻求职业规划,主要是缺乏明确的职业规划。需要寻求职业规划咨询,还有参加对应的职业培训,如此才能够帮助大家去理清思路,找到一个比较合适的职业方向,能有效制定合理的职业目标以及发展计划。在这种阶段可以激发个人的积极性,又或者是动力有效努力去实现自己的梦想。什么是躺平这个词汇在网络上已经逐渐的流传开来...

为什么指甲周围经常长倒刺?看完或许对你有帮助

为什么指甲周围经常长倒刺?看完或许对你有帮助
健康养生,快乐生活,这里是健康播报机,我是健康达人,带你一起科学养生! 我们都知道指甲是人体健康的晴雨表,平时很多人也会不时的观察一下自己指甲的情况,正常情况下如果身体非常的健康,指甲的表面红润有光泽,而且也不会出现凹凸不平的情况。但是你有没有发现指甲的...

王一博胡军电影《长空之王》聚焦新时代空军试飞员,揭秘最新型战机的诞生幕后

王一博胡军电影《长空之王》聚焦新时代空军试飞员,揭秘最新型战机的诞生幕后
  4月28日,电影《长空之王》全国上映。影片聚焦新时代空军试飞员,揭秘最新型战机的诞生幕后,由刘晓世导演,桂冠、刘晓世编剧,王一博、胡军、于适领衔主演,周冬雨特别主演,卜钰、翟宇佳、王子宸、芦鑫主演,并将作为第13届北京国际电影节闭幕影片。 电影《长空之王》讲述新型战机诞生背后的故事,将镜头对准空军试飞...

丰田下一代电池技术公布:能跑1500公里

丰田下一代电池技术公布:能跑1500公里
[汽车之家 资讯] 日前我们获悉,丰田已确认了下一代电池技术的部分细节,据了解,到2027年,丰田旗下产品将会拥有最大621英里(约合999公里)的续航表现,后续的最大续航里程可能会达到932英里(1500公里)。同时,丰田还将提供多种不同续航的电池选项,有些会侧重于性能表现,还有一些则侧重于日常经济性。丰田还公布了更多...

女鞋巨头玖熙低调回归北京 实体店增设女装业务

女鞋巨头玖熙低调回归北京 实体店增设女装业务
  “NINE WEST又回来了?”近日在某社交平台上,一位IP地址为北京的博主发布了一组“NINE WEST”线下店铺的实拍图,并称“记得好多年前(这个品牌)所有的店都撤柜了,现在是又回来了吗?”  该博主提到的NINE WEST,品牌官方中文名为玖熙,曾是美国女鞋销售龙头之一。据了解,该品牌曾在2018年宣布退出国内市场,后于2...

元旦去海南旅游能下水玩吗 海南一月份冷不冷呢

元旦去海南旅游能下水玩吗 海南一月份冷不冷呢
每年的1月1日是元旦,这时候全国大多到了冬季。不妨趁着元旦假期,去海南玩一玩,感受一下温暖的冬天。海南是我国南方的一座热带海岛,那么元旦去旅游可不可以下水玩呢?元旦去海南旅游能下水玩吗一月份过来海南的话,第一要看天气。如果遇到降温,就不要考虑下水的问题了。第二要看地区。海南的气候,尤其是冬季南北反差巨...

中国建设银行信用卡申请进度怎么查询?

中国建设银行信用卡申请进度怎么查询?
您可以通过以下途径查询中国建设银行信用卡申请进度:1、在建设银行官网上查询:登录中国建设银行官网,在信用卡页面找到“我的申请”或“进度查询”等相关链接,输入您的申请信息(如姓名、身份证号、手机号码等),即可查询您的信用卡申请进度。2、拨打客服热线查询:拨打中国建设银行客服热线95533,按照提示语音操作,选...

海南省民俗文化-临高人偶戏

海南省民俗文化-临高人偶戏
临高人偶戏国家级非物质文化遗产。临高人偶戏是全国惟海南独有、世界少见的稀有剧种。主要流行于海南岛西北部的临高县及周边的海口市、澄迈县、儋州市等市县中操临高话的乡镇,是中华民族非物质文化遗产的瑰宝。据老艺人相传,临高人偶戏源于南宋末期。临高先民求神拜佛逐鬼驱邪时,皆用人型杖头木偶。据光绪十七年续修的《...

临澧有哪些特色水果 湖南临澧特产

临澧有哪些特色水果 湖南临澧特产
临澧的特色水果有临澧杂柑、中华脆蜜桃、太浮中华猕猴桃、杨板西瓜、赵家葡萄、临澧红枣、临澧柑橘。1、赵家葡萄赵家葡萄是湖南临澧的特色水果,其产地有着优越的地理环境,三面环山,一面临水,气候宜人,环境优美,适宜葡萄种植,所产出的葡萄口感好,糖度高,品质优越。2、临澧杂柑临澧杂柑是湖南省临澧的特...

茶叶渣的另外十大妙用小妙招

茶叶渣的另外十大妙用小妙招
摘要:在泡完茶之后大多数人都顺手把茶叶渣倒掉了,却不知道茶叶渣也有很多用途的。今天小编就来和大家介绍茶叶渣的十大妙用,一起来看看吧!茶叶渣另外十大妙用1、泡个美肌茶渣浴绿茶富含叶绿素、维生素C,咖啡碱、茶碱含量也较多,较易刺激神经。所以绿茶能深层清洁肌肤,具有柔软角质层、使肌肤细嫩...
返回顶部