借助Go西南证券开户ogle的Meena,人工智能助手会变得更加聪明吗-

上一年,咱们看到了OpenAI的GPT-2模型生成的连接的多段文字。本周,来自谷歌AI的一篇新论文标明,依据巨型神经络和许多数据的谈天机器人能够坚持连接的对话,在多个回合中坚持上下文相关,而且能够就任何主题进行对话。该谈天机器人称为Meena,乃至能够创造笑话(见图片)。

作为在这一范畴作业的人,我形象深入。 (我是Rasa的联合创始人,Rasa是一家供给Meena或许会与之竞赛的开源对话式AI结构的公司。)但这对AI帮手的未来意味着什么?

已知的主意,履行得很好

更多数据,更多计算机功用,更好的模型,对吗?咱们一向都在听到这个音讯,可是将这个主意实践进行测验很风趣。您能够将其推多远,收益在哪里平整?这是OpenAI的GPT-2模型及其冠军Dota体系之类的多条有目共睹的成果背面的一个问题。结合一些已知运作杰出的神经体系结构和算法,并检查对数十或数百倍数据进行练习后它们能够完成的方针。 Meena是依据变压器体系结构的序列到序列模型。这些都是广泛运用的东西,但这是任何人第一次大规模练习这种模型。

本文的“最新”部分是一种用于评价谈天机器人质量的建议办法。 Meena是一个敞开域体系,这意味着它能够议论用户想要的任何作业。评价这类模型十分困难,而提出杰出的目标自身便是整个范畴。本文的处理方案十分简略:向人们展现谈天机器人的答复,然后先问他们,这种答复有意义吗?其次,此呼应详细吗?曾经的序列到序列模型的一个问题是倾向于安全运用它并提出比如“我不知道”或“确认”之类的通用呼应。

上一年的GPT-2模型接受了一项十分简略的使命练习:仔细阅览一堆文本,然后依据您现已看到的单词猜测下一个单词。从概念上讲,Meena的练习方法没有什么不同。络只需求猜测下一个呼应即可。

慎重的理由

首要要说到的是,这项作业是预印本,没有通过同行评定。作者提出了一些有力的建议,这些建议必须经专家检查。最显着的问题是,运用26亿个参数,作者将不得不令人信服地标明,Meena并没有(大约)记住对咱们能够说的任何内容的恰当呼应。无论怎么,咱们现已能够看到Meena有一些显着的局限性。

大型神经络一般看起来很聪明,可是却有许多缺陷。想一下那些欺骗性的修补程序,它们欺骗了目标检测算法,但却永久不会丢掉人类。相似地,GPT-2模型能够生成令人形象深入的连接文本,但在逻辑上不一致。

许多看起来像自然语言了解问题的事物实践上是关于了解实践国际的。我很感谢Meena的作者供给了一些脚本,这些脚本记录了该机器人严峻失利的状况。我喜爱Meena关于亚利桑那州沿海地区的梦想轶事:“是的。我住在亚利桑那州南部,所以这里有许多冲浪活动。”这应该提示咱们,这些模特并没有真实了解。便是说,它们是功用强大的东西,能够很好地(或欠好!)运用。

借助Go西南证券开户ogle的Meena,人工智能助手会变得更加聪明吗-

人工智能是公共关系的危险

看着本文中的示例对话,我巴望有机会与Meena攀谈。我很猎奇,我想测验许多作业。那么为什么没有可用的演示?

Google在随附的博客文章中告知咱们,这与安全性有关。在本文中,作者对他们的练习数据来历不满意。我以为这是Reddit,由于他们议论的是“ …在谈论树结构中的公共范畴交际媒体对话”。您还能从哪里取得341 GB的相似对话的文字?

值得注意的是Google没有揭露发布此内容。即便在研讨阶段,作者也运用了额定的过滤器来消除“灵敏或毒性反响”。这不简单做到。依据上下文的不同,即便是无害的答复(例如“是”和“否”)也会形成严峻的问题。

上一年,微软发布了有关名为DialoGPT的模型的相关作业。 DialoGPT的作者发布了他们的模型,但没有发布答应任何人轻松运用它的解码器。谷歌表明,他们或许会在未来发布Meena的模型,但明显他们不期望在Google域进步行在线演示,也不想以任何方法与Google品牌树立相关。

在对实践国际的谈天机器人产生任何影响之前需求产生什么

要使此成果对实践国际的谈天和语音帮手产生任何影响,需求进行许多作业。首要,作者需求发布模型和练习数据,以便其他人能够依据此研讨。依据博客文章,谷歌“或许挑选在未来几个月内供给它。”

假如模型已发布,咱们将在接下来的几个月中看到数十篇依据此作业的论文,剖析该模型并以论文中的思想为根底。还记得2018年的BERT模型吗?剖析其行为的作业量很大,因而该子字段有其自己的称号:BERT-ology。

咱们怎么运用这项研讨来改善谈天机器人?最大的妨碍是像Meena这样的模型是端到端的:您输入一条音讯并取得呼应。没有体系的办法来操控模型要评论的内容。咱们能做的最好的作业便是对许多提名人进行抽样调查,并期望其中之一挨近咱们想要的。 Meena能够在多个回合中传递上下文的才能令人形象深入(只需从头阅览页面顶部的笑话即可),但该机制对咱们而言是躲藏的。开发人员不能仅仅“勾搭”并将这种功用带入其AI帮手中。

假定咱们正在构建一个谈天机器人,而且想将Meena集成在一起仅仅为了开个好打趣。每逢用户说“给我讲个笑话”时,谈天机器人就会移交给Meena。这很简略,应该能够正常作业。可是考虑到Meena模型的巨细和参数的数量,假如您能在5秒钟内涵典型的硬件上得到呼应,我会感到惊奇。我真的期望能够供给练习数据和模型,以便研讨人员和工程师能够将这些主意付诸实践。紧缩大型模型以使其精简和快速是我作业的Rasa的活泼研讨范畴。

更不用说,假如Google对发布如此慎重,那么在处理公认的危险之前,很少有人会听任Meena听任用户运用。依据Google的说法:“处理模型中的安全性和误差是咱们重视的要点范畴,鉴于与此相关的应战,咱们现在没有发布外部研讨演示。”

那么,AI帮手会变得更聪明吗?是的,但这不会在一夜之间产生。要取得这些成果并将其转化为实践的AI帮手的实践改善,将需求许多的创造力。当然,虽然我有成见,但我深信敞开源代码结构将以最快的速度立异。

Alan Nichol是Rasa的联合创始人兼CTO,Rasa是一家供给开源对话式AI结构的公司。

发布于 2023-04-01 23:04:43
收藏
分享
海报
44
目录