几十年前,我们可以与智能手机或智能扬声器交谈并期待答案的方式听起来像是科幻小说,但星际迷航般的幻想已经在数百万人的口袋、办公桌和柜台中完全实现(如果不是数十亿)的客户。更神奇的是,借助 Google Assistant 上的 Continued Conversation 等工具,您可以就后续问题进行近距离对话,该工具在回答新问题时利用了后续问题的上下文。而且,就像谷歌的许多基于机器学习的软件功能一样,它的工作方式非常聪明。
我们都已经习惯了语境的力量,以至于它的概念通常不会进入我们的脑海,除非它明显缺失。无论您是在与朋友谈论一些新的小玩意还是在阅读一本书,信息都可以很容易地省略而不会模糊意思。例如,如果您正在与朋友谈论即将推出的手机的规格,他们会问:“要多少钱?” 您无需重申电话作为主题。这是暗示的。小说中的快节奏描述或经济教科书中对因果关系的讨论也是如此——你不必重复前面的所有内容来理解所说的内容。面对上下文,即使“不”也可以是一个完整的句子。
这是人类容易理解但机器很难理解的事情之一。上下文隐含在我们的脑海中,但它并不是计算机处理语言的固有方式,尤其是在被答案打断时。但是,当一个新问题的上下文可以被理解为与前一个问题的某些主题或主题相关时,像 Google Assistant 的Continued Conversation这样的系统效果最好,这样你就不会更明确、更完整地重复自己。
谷歌上周在其 AI 博客上发布了详细解释,详细说明了智能助理是如何学会理解上下文的,它得出的解决方案非常简单:重新表述后续问题以包含它。这有一个很大的优势,因为谷歌可以简单地在助手已经在做的事情上安装另一个系统,而不是重新设计它如何从头开始处理问题以适应缺失的信息。
这一切背后的“如何”令人着迷,因为您可以通过多种不同的方式以编程方式将上下文添加到新查询中。事实上,谷歌使用多种不同的方法来做到这一点,分为三大类:
考虑到语法和语言结构,将先前查询和答案中的点点滴滴和短语塞进后续问题中,这样它们就不会胡言乱语了。
匹配它在来自流行或常见问题的先前查询中识别的关键术语,以查看是否适用于这种情况。
基于机器学习的生成器在可以动态生成候选者的样本上进行训练。
机制不同,但效果是一样的,助手会做所有这些,生成一些不同的候选者,这些候选者可能是你后续问题的“完整句子”版本,助手更有可能做到这一点理解。通过这些技巧,诸如“何时?”之类的问题。可以变成“埃菲尔铁塔是什么时候建成的?” 当被问及“谁建造了埃菲尔铁塔”时。
然后对这些不同的“候选人”进行评分,因为它们可能并不都是准确的。谷歌根据与前一个查询的主题相似性以及它是否看起来不完整或语言上的错误/不合语法对它们进行评分。谷歌还试图消除新查询的误报,这些查询可能看起来像是其中一些模型的后续问题,但实际上是完全独立的。
最后,选择最佳候选者(如果认为适用),而助手会解析问题的完整句子、改写版本来代替上下文删节的查询。谷歌表示该系统适用于“大多数”查询,虽然我确实记得必须自己改写一两个问题以更好地使后续问题的上下文清晰,但它的功能令人惊讶。最重要的是,如果您使用的是持续对话,它会产生一个更加自然的过程。与其像搜索引擎查询那样尝试优化每个问题,您可以在寻求更多信息时更自然地思考和说话,并且助手本身会添加必要的上下文以了解该问题与已经说过的内容相关。
如果 Google 对环境计算的愿景是未来,那么像这样的工具可以让计算机更容易与之交互,它将在此基础上构建。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!