手机版

张钹院士：满足这五个条件你的工作就将被AI取代(4)

发布时间：2021-11-15 来源：网络整理

小中大

字号：

　　怎么来解决这个问题呢？实际上就是要解决从‘Without’到‘With’理解的问题。人工智能现在有两种基本方法，一种是用符号模型来模拟理性行为，符号模型可以表达信息的内容，所以它是在一个语义的符号空间里头，但是非常不幸，这个离散的符号表示，数学工具很难用，很多数学工具用不上去，所以它发展很慢。在模拟感性行为的时候，我们用的是特征空间的向量，向量就是数，可以把所有的数学工具都用上，优化的工具、概率统计的工具全部用上。所以数据驱动方法这几年发展非常快，再难的问题，下围棋非常难吧，计算机也可以‘算’出来。但是它有一个非常大的缺陷，它是在特征空间里，缺乏语义。我们用数据去训练一个模型，所谓‘黑箱学习法’，加上你的数据质量不高，很难学出有用的东西。什么叫概率统计？重复多了就是真理。如果数据质量差，充满了‘谎言’。谎言重复多了，就变成真理了。

　　我们现在想出的解决办法是这样的，就是把这两个空间投射到一个空间去，这个空间叫做语义的向量空间。也就是说我们把符号变成向量，同时把特征空间的向量变成语义空间的向量。怎么做？一是通过 Embedding（嵌入）把符号变成向量，尽量保持语义不变，可惜现在的方法都会引起语义的丢失，我们只能在投射的过程中让语义丢失得少。第二方面做的工作比较少，就是 Raising（提升），把特征空间提升到语义空间去，这主要靠学科交叉，靠跟神经科学的结合。只有这些问题解决以后，我们才能够建立一个统一的理论，因为过去的感知和认知是不同的处理方法，大家说不到一块，如果我们能够投射到同一空间去，我们就可以建立一个统一的理论框架，这是我们的目标。在语义空间处理就可以解决理解问题，但是这项工作是非常艰巨的。

　　介绍一项我们现在做的工作。人工神经网络为什么不能得到语义信息呢？人脑的神经网络为什么可以呢？差别就在这里，我们现在用的人工神经网络太简单了，我们正想办法把脑神经网络的许多结构与功能加进去，我们这里只用了‘稀疏发电’这一性质，就可以看出一些效果，人脸、大象或者鸟的轮廓，神经网络可以把它提取出来。

　　还有一个办法就是把数据驱动跟知识驱动结合起来。刚才讲了，人的智能没法通过单纯的大数据学习把它学出来，那怎么办？很简单，加上知识，让它有推理的能力，做决策的能力，这样就能解决突发事件。我们现在做的工作就是把这些结合起来，这是我们的基本思路，知识也好，数据也好，都投射到同一空间，然后都用同样的数学方法进行处理，这方面我们已经做了不少工作。

　　最后做一个总结，我们从这个坐标看人工智能，横轴代表领域的宽窄，从单领域到多领域、到开放领域。纵轴代表信息的确定性与完全性，从完全到不完全、从确定到不确定。在左下角代表最容易的，就是刚才讲的符合 5 个条件的，现在人工智能在这部分解决得非常好，我们用白色来表示它，AlphaGo 在这里，深蓝在这里，工业机器人在这里。现在我们正在向灰色地区去走，打牌，信息不完全，现在打德州扑克，一人对一人，计算机能战胜人类，多人对弈，计算机还不行，这是灰色地带，我们还可以做，为什么可以做？尽管打牌是不确定的，但是它在概率意义下是确定的，你拿的这副牌的概率，可以算出来，同花的概率是多少，排成顺的概率是多少，既然概率能算出来，最终人类肯定会被计算机打败。Watson 在右边，它的领域比较宽，但是它是确定性的，所以是在灰色的区域。往右上方去就比较难了，自动驾驶、服务机器人、大数据分析，它是一个大框，有的简单，有的困难，就自动驾驶来讲，专用道、行车很少，路况简单等，在白色或者灰色区，如果路况复杂就到了黄色区域，黄色区现在计算机还解决不好。最远的在哪儿呢？右上角，图灵测试。大家对图灵测试有很多误解，其实图灵测试是开领域问答，很难！索菲亚做得怎么样？很糟糕。自然语言理解也在这里，复杂环境下的决策在偏左一点的地方，这也是很难的。所以我们人工智能现在是从左下角往右上角走，我们现在处在出发点附近。有的人想把它用一些名词来区分人工智能的不同发展阶段，有专家问我，你的看法怎么样？我建议不要用新词，用新词往往说不清，很麻烦，有的人说现在是弱人工智能，以后是强人工智能，也有人说现在叫增强智能（Augmented Intelligence）也是 AI……概念太多说不清，还是简单一点，‘我们正在通往真正 AI 的路上’，现在走得并不远，在出发点附近，人工智能永远在路上，大家要有思想准备，这就是人工智能的魅力。大家为什么这么重视人工智能？因为我们永远在路上，这就吸引我们去解决这些问题，这些问题一旦解决了，人类的社会进步、人类的生活就会发生本质上的改变。