搜索的新时代(五)_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 工程 • 技术

搜索的新时代(五)

《科学世界》  发表于 2018年05月08日

科学世界:将来的搜索想象起来非常有意思。

马维英:跟大家认知的传统搜索完全不一样。以前我们从来没有这种能力。也就是说计算机在看到一段文字之前,已经把全世界的东西读完、记下来,还变成了结构化的数据,而且全部可以是图的表达。这张图是从全世界的文字里面抽出来的。现在它通过这张大图来理解目前看到的这段文字,分析其中各种元素之间的关系。这个能力运用起来不得了。人记不住那么多东西,而计算机可以记住。但是搜索引擎的推理能力,还有常识,目前还比不上人。

 

科学世界:这些为什么难以通过深度学习来提高?

马维英:因为人的很多语言牵涉到更高级的表达。现在机器擅长的还是向量计算,如果能够将信息表达在一个向量空间中,那么在其中进行各种计算,这是机器能做的。当牵涉到一些高维的概念,概念与概念之间是更为复杂的图的关系,对这种图的搜索能力还在构建中。这个能力让搜索引擎能够在更高的层次做合理的表达。

但是计算机在学习处理这类表达方式时,还欠缺一些大数据,结构化数据还不够多。问题是我们到哪儿去找这种信息,能够不断让机器可以去进一步学。所以也有人问,人类所有的知识到底是不是靠语言能够表达出来?可能有很多知识还是不容易完全用自然语言表达。

 

科学世界:如果素材或资料够多,机器会学得很快。

马维英:对,机器厉害的一个地方就是大数据,最近这几年的突破也是因为有数据。但是数据分几种,一种是很低等级的数据,只能学一些比较低等的特征。有一些比较结构化的,像超链接等,或者是像维基百科这种已经告诉你这个类别和那个类别有什么关系,这些数据都是比较高阶的,有结构的。这种数据越多越好。

接下来能不能创造出一种应用,能够让人更自然地给计算机提供所需要学习的信息,这是我们要思考的。藉由做Office 365,我们刚好有这样一个机会。例如你天天写电子邮件,我就在那里学你怎么写。我们已经开发出一个技术,你边写电子邮件,计算机立刻建出一个实体图来。你输入的文字里提到的人、项目、单位、时间等,它们之间的关系立刻实时建立出来。机器可以实时把你的知识表达图,就是这一段文字在全世界的知识图上面所表达出来的部分是什么告诉你。

 

科学世界:这有些科幻的味道。

马维英:下一步我们希望把这个东西用在小冰身上。小冰能根据邮件内容预测是不是要帮你预定会议,当然这是最直接的。它还可以帮助你更快地完成邮件,帮你结构化这个邮件。

比如有时候我们的电子邮件中还想输入超链接。我们正在研究的一个东西,就是你写完电子邮件后可以自动产生链接,比如邮件里提到某个项目,那个项目有个网页。如果收件人不知道这是什么,一点就能打开网页来了解。我们的程序可以区分这个收件人是谁,自动帮你生成超链接。又比如,你在用英语写信时,它告诉你基于全世界曾经出现的类似表达,下一句最可能出现的是这句,你要不要参考一下。这些都是以前没有的。这个东西还要做成很简单的形式。现在只是显示了搜索具有这样的能力,但到底最终能做出什么,我们还在思考。


(本文发表于《科学世界》2015年第11期)



全部评论

你的评论