胡郁：机器向人脑的靠近—新闻

作者：胡郁来源：中国科学报发布时间：2016/7/5 9:16:46

选择字号：小中大

胡郁：机器向人脑的靠近

■胡郁

机器擅长的是运算智能，感知智能方面，就是看到世界、听到周围世界的能力，机器也在快速赶上来。但在认知方面，让我们能够有语言、语音，能够积累知识、能够进行判断等方面，机器其实比我们差得很远。

这也是科大讯飞现在以语音和语言为入口的计算机的认知革命。我们所执行的讯飞超脑计划想要做的事情，就是把机器的感知智能和认知智能通过传感器和算法感知世界，并且能够对自然的人类世界进行认知，这将作为人工智能非常重要的突破点。

怎样实现这种突破，有两种不同的途径，一种和脑科学非常相关，我们可以对大脑所有的神经元构造和它的工作机理进行分析，然后根据大脑的整个工作机理重构出来真正和大脑相同的机制，但这条思路用时比较长。

另外一条思路就是用互联网思维，利用我们机器学习算法和大数据在尽可能快的过程中学习，就像AlphaGo一样，不完全能模仿大脑，但利用机器运算的方法能够模拟我们的感知和认知。

从人脑中获取智能最关键的一点是，就像人类学会飞翔，但我们并没有造一个鸟出来，而是利用了空气动力学。我们研究大脑，其实并不是把大脑完成复制，而是希望找到大脑中的智力动力学，进一步优化机器学习的算法。

如果用互联网思维来解决、改进我们的人工智能，要感谢三方面的进展：一是人工神经网络，另外拜互联网和移动互联网所赐，我们可以得到大量数据；更重要的是我们有千千万万的算法，有直达用户的产品，这些产品把用户的使用习惯源源不断传入后台，我们可以利用网络效应不断优化它们。

真正人工智能的框架应该是什么样的呢？人类大脑皮层在工作过程中分为两个层面：一个叫感知层面，就是视觉、听觉和触觉；还有认知层面，当我们看到一只猫、听到猫的叫声，人脑里有一个概念，这些概念形成了语言中的单词和词汇，就是“猫”的概念。所以在讯飞超脑里分两个层面：感知智能是对我们听到的、看到的、触觉到的东西进行识别，同时把识别结果上升到我们认知智能的层面，形成一个概念空间的表示和推理，在过去五年中我们相继把深度学习网络应用在感知和认知，包括视觉、听觉、自然语言、翻译等各个方面。

我们通过递归的方法，可以让神经网络模拟大脑的感觉，这是现在最新型的递归神经网络用于语音识别的过程。但光有递归还不够，现在最新的一个方式是用图像的方法识别语音，这是当前最新的技术。

当语音进入我们的耳朵时，我们耳朵里的纤毛会根据它的长度与语音中不同的频率进行共振，如果把共振的频率分析出来，我们可以得到语谱图。我们应用一个新型的卷积神经网络来处理语音图像，就得到了语音识别当前最好的结果。我们可以看到，即使是跟最新的递归神经网络相比，用卷积神经网络，也就是用识别图像的方法，我们仍然能取得48%的提高。

现在我们采用一种连续的空间来表现词语，每个字、词都可以用“词语卷积”的方法，用一段连续的数字，相当于一个空间里的坐标系，这样每两个单词之间的距离就可以把它计算出来。我们把所有词聚了一下类就可以看到这么一个结果，比如新浪、网易、腾讯，这些词语是连在一起的；吕布、张飞、关羽、诸葛亮，他们是比较接近的。其实在我们的大脑皮层中，如果你来测量，比如播放一个词语，我的大脑里会出现放电，相关词语在大脑皮层中存储的位置也是非常接近的。

利用这种方法，我们建立了一种表现词语的空间概念的表达体系，在这样的表达体系之下，我们可以进一步地去分析词语层面、句子层面和篇章层面，它们在各个层面上的连接和计算的距离。

（作者系科大讯飞轮值总裁，本报记者贡晓丽根据其在第三届网易未来科技峰会上发言整理）

《中国科学报》 (2016-07-05 第5版技术经济周刊)

以下评论只代表网友个人观点，不代表科学网观点。

�� SSI �ļ�ʱ��