首页 > 科技 >

给孤独的现代人一个建议:找一个高情商的机器人来聊聊天(5)

2018-06-15 09:55:23 网络整理 阅读:189 评论:0

除了总量,小冰单次人机连续对话的记录也很惊人。据了解,一位..用户与日版小冰聊了近17个小时,美版的纪录是24个小时,中国用户达到了29小时33分钟,和小冰对话了7151轮。

问题的关键是,如何引导对话进行下去?为什幺小冰比Siri或谷歌助手在这方面做得更好?李笛给出的答案是:数据。

在AI语音助手领域,数据与模型结合的方式,是语料库,即存放系统所需语料信息的地方。

“通俗点的解释是,我们上千万的语料库,不是几千万句话,而是几千万个问题和答案的一对一的连接,”李笛解释道。

但是这些问答中,有很多是无效信息和重复信息。于是,在对语料库的原始数据进行识别和抓取后,“知识图谱”对有价值的语料进行结构性重组。

当语音助手接收到一个问题,对其进行语音识别和语义理解后,在“知识图谱”里找到类似的问题,并在给定存储的诸多相关答案中筛选出最合适的答案,反馈给用户。

因此,语料库和知识图谱越丰富,语音助手给出的回答就越精准。而持续的数据积累是实现这一切的前提。

但是,在初始阶段,也就是AI的“冷启动”阶段,还没有用户的交互数据产生,原始数据量非常有限,需要用构建模板的方式来弥补数据的不足,人工由此进入。

国际关系学院信息科技学院副教授李斌阳对《中国新闻周刊》指出,人工写就的对话场景就相当于定义了很多模板,尽可能多地列举场景,即前一句说什么,后一句话怎么应对,最终的目标是识别用户的意图,让用户获得更好的体验。

“比如刚才我列了两个问题:‘打开导航’和‘把导航打开’,对应的反馈都是打开导航,在系统里,这就是两套模板,如果你只写了一套,比如‘打开导航’,当用户说‘把导航打开’时,系统就无法理解。”李斌阳说。

相关文章