多种学习手段和方法,从大量的数据中提炼出抽象的知识,从而揭示出蕴涵在这些数据背后的客观世界的内在联系和本质规律,实现知识的自动获取。显然这是一个富有挑战性、并具有广阔应用前景的研究课题。
从数据中挖掘并发现知识,首先要解决被发现知识的表达问题。而最好的表达方式目前看来还是自然语言,因为它是人类的思维和交流语言。所以知识表示的最根本问题就是如何形成用自然语言表达的概念。
在杜克的Sala输入法中,其实已经大量用到了这些知识,要实现语音识别高辨识率,核心部分就是抽象提炼各种语音特征的能力,只不过这部分工作都由克里完成,现在杜克要做的是将克里的能力拷贝移植到地球的计算机上面。
波尔教授虽然没有机会深入了解Sala输入法的实现过程,但是凭借着世界顶级专家的直觉,波尔能够判断在Sala中应该使用了相关的技术,这才是波尔教授爽快同意杜克博士申请的最主要原因,他在这方面的研究已经进行了很多年,但是一直都没有获得突破性的发展,他的研究团队需要补充一些新鲜的血液来进行突破,当然不是说毫无所获,至少类似Siri这种程度进展还是不少的,但是这还远远不够,如果你用过Siri,你就知道这充其量也就是婴幼儿智能水准。
波尔教授的这个研究符合杜克的预期,因为在杜克下一步计划中,语音识别应用的一个方向,就是让机器可以理解部分的自然语言,这个就同人工智能密不可分了。大家知道现在的电脑基础是二进制,也就是0或1基础上发展的,要让电脑理解人类语言,这个难度真的不是一般大。
这么说吧,人类语言中一语双关的情况太多了,即使对于“你吃了吗”这样简单的句子,在不同语境下都有好多种不同的内涵,足以让电脑逻辑为之抓狂。
比如北京人见面如果问“你吃了吗”不过是一句司空见惯的打招呼,如果你傻乎乎地认为对方要请客,你就二了。
如果是俩个相熟的人打电话问“你吃了吗”,如果俩人离饭点近,可能是邀请一起吃饭,如果是俩人距离远,不过就是一种关心式的问候。
甚至说话的语气不一样,同样语言中的内涵也大不一样。
如此种种语境,对于人的思维来说是非常好分辨出来究竟是打招呼还是问候,可是电脑不行,它只有逻辑推理的能力,像语言交流这种几乎无穷多组合的情况,你得给多少限制选择条件,才能够让电脑理解?
从思
本章未完,请点击下一页继续阅读!