专访丨周志华：深度学习理论探讨比应用滞后太多

文章来源：网易科技

2017未来科学大奖颁奖盛典网易独家访谈间直播正在进行。南京大学教授周志华在与深鉴科技联合创始人汪玉对话时表示，深度学习的理论探讨比应用滞后了“好几个量级”。

周志华在谈及人工智能近期的热潮时表示，这是源于机器学习在过去15年里取得了飞速进展，而机器学习的实质就是人类希望通过计算机来寻找出数据中所包含的规律；周志华认为，目前深度学习的优势在于能更好地发挥出数据的作用，而且目前深度模型多是基于神经网络，这就能更方便快捷地利用上新增加的能力，但同时深度学习模型的理论基础不是特别扎实，“很多时候它到底怎样能做得更好是在靠尝试，而不是有一个很清楚的理论告诉我们该怎么做、不该怎么做，这是它的弱点。”他认为，深度学习的理论探讨比应用滞后了“好几个量级”。

周志华认为，机器学习里有很多其他技术的优点正好可以弥补深度神经网络的弱点，而它这些技术的弱点又可能是深度神经网络的优点，机器学习如果能够借鉴神经网络的成功而把弱点克服掉，这将带来更大的技术进步。

在谈及人工智能是否会造成人类失业时，周志华表示，现在的职业流失是必然的，人工智能的技术应用可以看成是一次新的技术革命，“每次技术革命如果不能破除一些传统职业，那就不是真正的革命。”

不过，他认为人工智能是在帮助人类把一些繁重的智力劳动缓解出来，一些重复性强的智力劳动职业可能会受到影响，但一定也会产生新的行业，“对于从业者来说要不断学习，就像原来拉拖车的工人，如果你没有学习怎样开卡车，碰到的处境可能是不太好的，但如果及时跟进、及时学习开卡车了，我想你的职业前途一片光明。”

以下是对话节选（有删减）：

汪玉：下面有请南京大学的周志华老师，周志华也算是我的老师之一了，因为我是读他的书长大的，周老师请坐。

刚才我在楼上也听到了周老师关于人工智能的观点，我还是想请周老师给大家介绍一下您现在在做哪方面人工智能的研究？

周志华：人工智能是一个非常广的领域，我本人做机器学习方面的研究，实际上这一轮人工智能的热潮就是因为机器学习在过去15年里取得了飞速进展。大家可能听到“深度学习”这个词更多，深度学习实际上是机器学习里的子领域，机器学习到底在做什么？简单地说，如果大家手上有很多数据，并认为数据中包含了一些规律，这个规律人并不是很明确地知道，希望通过计算机算法、利用计算机辅助帮你把规律找出来，后面用到分析数据得到规律的算法就是机器学习的研究对象。我们就是研究怎样设计、分析和应用，从数据里产生模型、规律算法的这么一个学科。

汪玉：您已经做了很多年的机器学习方面的研究，您能不能从历史发展的角度给大家解释一下为什么人工智能突然就起来了，当然刚才从您的角度说，这其实是一个很长的积累过程，能不能给大家分享一下这个历史？

周志华：其实整个人工智能的发展在我看来大概经历过三个阶段：第一个阶段，大家可能知道1956年美国达特摩斯会议，当时Joma（音）召集了很多年轻人一起讨论，最早大家觉得我们只要把逻辑推理做出来就能做很好的事情了，后来发现光有逻辑推理还不够，要有知识，人工智能第二阶段就是研究知识工程。再后来发现获取知识非常困难，就想能不能自动获取知识，然后就开始研究机器学习。

机器学习作为学科进入这个舞台其实是在80年代初，那时候大家就做了很多事，但离真正解决我们现实应用里的问题还有一定距离，后来又经过二十多年的耕耘，到2010年左右很多应用领域的人回头一看才发现机器学习领域的人已经给他们准备好了应用工具。

其实机器学习的发展本身是很漫长的过程，过去五六年里我们看到人工智能很多应用爆炸式地出来，其实是因为过去二十年我们积累了很多技术，这些技术在不同领域发挥它的作用。

汪玉：现在工业界应用比较广泛，您觉得深度学习大家一般说得比较多一点，深度学习自身有什么好处和不好吗？

周志华：今天我们说的深度学习是一种非常复杂的模型，当我们有了很大的数据之后它能够更好地发挥数据的作用，所以这是它好的方面。

另外一个好的方面，今天我们的深度模型很多是基于神经网络的，神经网络模型有一个很好的优点，就是它能够很容易利用上新增加的能力。

汪玉老师是做硬件的，知道深度神经网络热潮背后很重要的推手其实是我们可以用GPU对深度神经网络进行加速，这是它两个非常大的优势。

但在另一方面现在深度学习模型的理论基础不是特别好，所以很多时候它到底怎样能做得更好是在靠尝试，而不是有一个很清楚的理论告诉我们该怎么做、不该怎么做，这是它的弱点。

实际机器学习里还有很多别的技术，它们的优点可能正好是深度神经网络的弱点，而它们的弱点又可能是深度神经网络的优点，机器学习往下发展，如果能够借鉴神经网络成功的性质，而把它的弱点克服掉，这会带来更大的技术进步，当然这里面有很多困难的问题。

汪玉：既然您说到了深度学习缺乏，现在理论研究还比较初步，大家都在努力做，这块您觉得有希望吗？其实我自己对这件事情也很好奇。

周志华：我觉得希望当然是有的，深度学习的理论探讨比应用滞后好几个数量级，一方面是做应用马上能见效，然后会有很多人尝试。另一个方面是做理论研究门槛相对比较高，像今天做深度学习很多企业应用的人，里面有很多现有的深度学习开发工具，这使得一个有比较好基础的程序员可能经过半个月训练就可以用这样的工具做很多应用了。

汪玉：这样会催生一个大的产业，“深度学习网络训练者培训”。

周志华：是，这应该是一个行业。我想表达的是，用这样的技术去做应用上手相对比较快，所以很多人去做。

另一方面，做理论可能要经过好多年的培养和很艰苦的学习才能有做理论分析的能力，而现在有这么一个状态，我们在深度神经网络尝试出很多新的改进，但做理论的人不够多，所以没办法对这些进展一一分析，这是它滞后的一个很重要的原因。

二是因为现在深度神经网络改进得太多了，大家从不同方面去走，做理论的人少，而做一个问题需要很长时间，他要想到底该做哪个分析才是最重要的，而这一点我们今天恰恰看不到。

因为我们看不到深度学习、深度神经网络里有哪一种技术、哪一种做法是真正Dominet（音）的，是大家一定要用的，当一些东西比较成形之后可能做理论才能跟得上去。

汪玉：理论跟不上去已经成为一个状态了，这种状态的出现对于应用本身有什么风险？

周志华：这里面其实有很大的风险，我们做这件事情现在看起来很成功，但你可能不知道它未知的缺陷到底在什么地方，只有我们在理论上搞清楚之后你才可能知道它最坏情况下大概会怎么样，有些时候你要避免它产生最坏的情况，可能要做一些额外的控制，而今天基本上等于我们做这件事看到了它好的方面，但它坏的时候会坏起来怎么样，怎么样会导致它最坏，完全不清楚，所以理论方面一定要加强，我也希望呼吁更多年轻人不要为短期应用里取得的成效迷住眼睛，要做一些有长远影响的工作，希望去考虑一些基础的、理论的重要的问题。

汪玉：这是非常重要的问题，在未来如果从行业角度慢慢把深度学习、机器学习里的很多技术用起来时，怎样能培养更多同学和未来的黏性人看这背后到底是什么样的机理，我们不说美国，在中国目前的大环境下有哪些举措是可以做的，能够推动人工智能，应用的研究大家都去做了，背后理论研究的推手从哪几个层面能做一些事情？

周志华：我想第一个能做的就像今天访谈一样推动倡导呼吁年轻同学们考虑这样的问题。第二，今天有很多企业都在挖人工智能方面的学生，在挖人工智能方面的人才，大家希望很快挖一个人来就能让一件事情见效，但有更长远考虑的企业能不能在人工智能研究的基础方面有更多考虑，这样对做这方面事情的年轻人有更多支持，很简单，现在的年轻人如果用一些深度神经网络的工具，马上可以在企业里拿到很高的薪水，但如果要让他沉下心来做一些很基础本质的问题，可能有很长时间是非常清苦的，这就造成年轻人不太愿意做这种非常深的研究。

但从长远来看，当人工智能过去二十年积累的技术红利被吃完之后，如果在本源上没有进一步往前走，这个“水”是不能长期持续下去的，我也希望有企业能支持更基础的人工智能的研究。

汪玉：好的，再次感谢周老师。

周志华：谢谢。

主持人贾梦霞：非常感谢汪玉总跟周志华教授的精彩访谈。