1、浅谈人工智能:现状、任务、构架与统一 | 正本清源原创 2017-11-02 朱松纯 视觉求索朱松纯 加州大学洛杉矶分校 UCLA统计学和计算机科学教授视觉、认知、学习与自主机器人中心主任VCLAUCLA2017 年 11 月 02 日 刊登于 视觉求索微信公众号目录引言第一节 现状:正视现实第二节 未来:一只乌鸦给我们的启示第三节 历史:从“春秋五霸”到“战国六雄”第四节 统一:“小数据、大任务”范式与认知构架第五节 学科一:计算视觉 - 从“深 ”到“暗”第六节 学科二:认知推理 - 走进内心世界第七节 学科三:语言通讯 - 沟通的认知基础第八节 学科四:博弈伦理 - 获取、共享人类的价值
2、观第九节 学科五:机器人学 - 构建大任务平台第十节 学科六:机器学习 - 学习的终极极限与“停机问题”第十一节 总结: 智能科学 - 牛顿与达尔文的统一附录 中科院自动化所报告会上的问答与互动摘录鸣谢引言“人工智能”这个名词在沉寂了近 30 年之后,最近两年 “咸鱼翻身” ,成为了科技公司公关的战场、网络媒体吸睛的风口,随后受到政府的重视和投资界的追捧。于是,新闻发布会、高峰论坛接踵而来,政府战略规划出台,各种新闻应接不暇,宣告一个“智能为王”时代的到来。到底什么是人工智能?现在的研究处于什么阶段?今后如何发展?这是大家普遍关注的问题。由于人工智能涵盖的学科和技术面非常广,要在短时间内全面认
3、识、理解人工智能,别说非专业人士,就算对本行业研究人员,也是十分困难的任务。所以,现在很多宣传与决策冲到认识之前了,由此不可避免地造成一些思想和舆论的混乱。自从去年用了微信以来,我就常常收到亲朋好友转来的惊世骇俗的新闻标题。我发现很多议论缺乏科学依据,变成了“娱乐AI”。一个在 1970 年代研究黑洞的物理学博士,从来没有研究过人工智能,却时不时被抬出来预测人类末日的到来。某些公司的公关部门和媒体发挥想象力,动辄把一些无辜的研究人员封为“大师” 、 “泰斗” 。最近,名词不够用了。九月初,就有报道把请来的一位美国教授称作“人工智能祖师爷” 。这位教授的确是机器学习领域的一个领军人物,但人工智能
4、是 1956 年开始的,这位教授也才刚刚出生。况且机器学习只是人工智能的一个领域而已,大部分其它重要领域,如视觉、语言、机器人,他都没有涉足,所以这样的封号很荒唐(申明一点:我对这位学者本人没有意见,估计他自己不一定知道这个封号) 。当时我想,后面是不是有人会搬出“达摩老祖、佛祖如来、孔雀王、太上老君、玉皇大帝”这样的封号。十月初,赫然就听说达摩院成立了,宣称要碾压美国,舆情轰动!别说一般老百姓担心丢饭碗,就连一些业内的研究人员都被说得心慌了,来问我有什么看法。我的看法很简单:大多数写报道和搞炒作宣传的人,基本不懂人工智能。这就像年轻人玩的传话游戏,扭曲的信息在多次传导过程中,逐级放大,最后传
5、回来,自己吓到自己了。下面这个例子就说明公众的误解到了什么程度。今年 9 月我在车上听到一家电台讨论人工智能。两位主持人谈到硅谷脸书公司,有个程序员突然发现,两台电脑在通讯过程中发明了一种全新的语言,快速交流,人看不懂。眼看一种“超级智能”在几秒之内迅速迭代升级(我加一句:这似乎就像宇宙大爆炸的前几秒钟) ,程序员惊恐万状。人类现在只剩最后一招才能拯救自己了:“别愣着,赶紧拔电源啊!”终于把人类从鬼门关又拉回来了。回到本文的正题。全面认识人工智能之所以困难,是有客观原因的。其一、人工智能是一个非常广泛的领域。当前人工智能涵盖很多大的学科,我把它们归纳为六个:(1)计算机视觉(暂且把模式识别,图
6、像处理等问题归入其中) 、(2)自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话) 、(3)认知与推理(包含各种物理和社会常识) 、(4)机器人学(机械、控制、设计、运动规划、任务规划等) 、(5)博弈与伦理(多代理人 agents 的交互、对抗与合作,机器人与社会融合等议题) 。(6)机器学习(各种统计的建模、分析工具和计算的方法) ,这些领域目前还比较散,目前它们正在交叉发展,走向统一的过程中。我把它们通俗称作“战国六雄” ,中国历史本来是“战国七雄” ,我这里为了省事,把两个小一点的领域:博弈与伦理合并了,伦理本身就是博弈的种种平衡态。最终目标是希望形成一个完整的科学体系,从目
7、前闹哄哄的工程实践变成一门真正的科学 Science of Intelligence。由于学科比较分散,从事相关研究的大多数博士、教授等专业人员,往往也只是涉及以上某个学科,甚至长期专注于某个学科中的具体问题。比如,人脸识别是计算机视觉这个学科里面的一个很小的问题;深度学习属于机器学习这个学科的一个当红的流派。很多人现在把深度学习就等同于人工智能,就相当于把一个地级市说成全国,肯定不合适。读到这里,搞深度学习的同学一定不服气,或者很生气。你先别急,等读完后面的内容,你就会发现,不管 CNN 网络有多少层,还是很浅,涉及的任务还是很小。各个领域的研究人员看人工智能,如果按照印度人的谚语可以叫做“
8、盲人摸象” ,但这显然是言语冒犯了,还是中国的文豪苏轼游庐山时说得有水准:“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中。 ”其二,人工智能发展的断代现象。由于历史发展的原因,人工智能自 1980 年代以来,被分化出以上几大学科,相互独立发展,而且这些学科基本抛弃了之前 30 年以逻辑推理与启发式搜索为主的研究方法,取而代之的是概率统计(建模、学习)的方法。留在传统人工智能领域(逻辑推理、搜索博弈、专家系统等)而没有分流到以上分支学科的老一辈中,的确是有很多全局视野的,但多数已经过世或退休了。他们之中只有极少数人在 80-90 年代,以敏锐的眼光,过渡或者引领了概率统计与学习
9、的方法,成为了学术领军人物。而新生代(80 年代以后)留在传统人工智能学科的研究人员很少,他们又不是很了解那些被分化出去的学科中的具体问题。这种领域的分化与历史的断代, 客观上造成了目前的学界和产业界思路和观点相当“混乱”的局面,媒体上的混乱就更放大了。但是,以积极的态度来看,这个局面确实为现在的年轻一代研究人员、研究生提供了一个很好的建功立业的机会和广阔的舞台。鉴于这些现象, 视觉求索编辑部同仁和同行多次催促我写一篇人工智能的评论和介绍材料。我就免为其难,仅以自己 30 年来读书和跨学科研究的经历、观察和思辨,浅谈什么是人工智能;它的研究现状、任务与构架;以及如何走向统一。我写这篇文章的动机
10、在于三点:(1)为在读的研究生们、为有志进入人工智能研究领域的年轻学者开阔视野。(2)为那些对人工智能感兴趣、喜欢思考的人们,做一个前沿的、综述性的介绍。(3)为公众与媒体从业人员,做一个人工智能科普,澄清一些事实。本文来历: 本文技术内容选自我 2014 年来在多所大学和研究所做的讲座报告。2017 年 7 月,微软的沈向洋博士要求我在一个朋友聚会上做一个人工智能的简介,我增加了一些通俗的内容。2017 年 9 月,在谭铁牛和王蕴红老师的要求下,我参加了中科院自动化所举办的人工智能人机交互讲习班,他们派速记员和一名博士生整理出本文初稿。如果没有他们的热情帮助,这篇文章是不可能写成的。原讲座两
11、个半小时,本文做了删减和文字修饰。仍然有四万字,加上大量插图和示例。很抱歉,无法再压缩了。本文摘要:文章前四节浅显探讨什么是人工智能和当前所处的历史时期,后面六节分别探讨六个学科的重点研究问题和难点,有什么样的前沿的课题等待年轻人去探索,最后一节讨论人工智能是否以及如何成为一门成熟的科学体系。诚如屈子所言:“路漫漫其修远兮,吾将上下而求索” 。第一节 现状评估:正视现实人工智能的研究,简单来说,就是要通过智能的机器,延伸和增强(augment)人类在改造自然、治理社会的各项任务中的能力和效率,最终实现一个人与机器和谐共生共存的社会。这里说的智能机器,可以是一个虚拟的或者物理的机器人。与人类几千
12、年来创造出来的各种工具和机器不同的是,智能机器有自主的感知、认知、决策、学习、执行和社会协作能力,符合人类情感、伦理与道德观念。抛开科幻的空想,谈几个近期具体的应用。无人驾驶大家听了很多,先说说军用。军队里的一个班或者行动组,现在比如要七个人,将来可以减到五个人,另外两个用机器来替换。其次,机器人可以用在救灾和一些危险的场景,如核泄露现场,人不能进去,必须靠机器人。医用的例子很多:智能的假肢或外骨架(exoskeleton)与人脑和身体信号对接,增强人的行动控制能力,帮助残疾人更好生活。此外,还有就是家庭养老等服务机器人等。但是,这方面的进展很不尽人意。以前日本常常炫耀他们机器人能跳舞,中国有
13、一次春节晚会也拿来表演了。那都是事先编写的程序,结果一个福岛核辐射事故一下子把所有问题都暴露了,发现他们的机器人一点招都没有。美国也派了机器人过去,同样出了很多问题。比如一个简单的技术问题,机器人进到灾难现场,背后拖一根长长的电缆,要供电和传数据,结果电缆就被缠住了,动弹不得。有一次,一位同事在餐桌上半开玩笑说,以现在的技术,要让一个机器人长时间像人一样处理问题,可能要自带两个微型的核电站,一个发电驱动机械和计算设备,另一个发电驱动冷却系统。顺便说一个,人脑的功耗大约是 10-25 瓦。看到这里,有人要问了,教授说得不对,我们明明在网上看到美国机器人让人叹为观止的表现。比如,这一家波士顿动力学
14、公司(Boston Dynamics)的演示,它们的机器人,怎么踢都踢不倒呢,或者踢倒了可以自己爬起来,而且在野外丛林箭步如飞呢,还有几个负重的电驴、大狗也很酷。这家公司本来是由美国国防部支持开发出机器人来的,被谷歌收购之后、就不再承接国防项目。可是,谷歌发现除了烧钱,目前还找不到商业出路,最近一直待售之中。您会问,那谷歌不是很牛吗?DeepMind 下围棋不是也一次次刺激中国人的神经吗?有一个逆天的机器人身体、一个逆天的机器人大脑,它们都在同一个公司内部,那为什么没有做出一个人工智能的产品呢?他们何尝不在夜以继日的奋战之中啊。人工智能炒作了这么长时间,您看看周围环境,您看到机器人走到大街上了
15、?没有。您看到人工智能进入家庭了吗?其实还没有。您可能唯一直接领教过的是基于大数据和深度学习训练出来的聊天机器人,你可能跟 Ta 聊过。用我老家湖北人的话,这就叫做“扯白”- 东扯西拉、说白话。如果你没有被 Ta 气得背过气的话,要么您真的是闲得慌,要么是您真的有耐性。为了测试技术现状,美国国防部高级研究署 2015 年在洛杉矶郊区 Pomona 做了一个 DARPA Robot Challenge(DRC) ,悬赏了两百万美金奖给竞赛的第一名。有很多队伍参加了这个竞赛,上图是韩国科技大学队赢了第一名,右边是他们的机器人在现场开门进去“救灾” 。整个比赛场景设置的跟好莱坞片场一样,复制了三个赛场,全是冒烟的救灾场面。机器人自己开着一个车子过来,自己下车,开门,去拿工具,关阀门,在墙上开洞,