导语:当我们把人工智能定义成依赖于机器学习为主的技术,来拟合世界的一部分,就会发现,这样一个定义可以很自然地应用到我们的生活中。
当下是人工智能的黄金时代,那科研里面人工智能的角色是什么?创业里面人工智能的角色是什么?人工智能如何从书本上跳到真实挣钱的公司产业,能够创造出许多既赚钱,又实现人生梦想的企业家和创业者呢?
近期,创新工场AI工程院副院长王咏刚在北大做了一场名为“人工智能时代的科研与创业”的演讲,在此次演讲中,王咏刚从美图上市谈起,谈到人工智能的科学定义,人工智能的历史,科研与创新的关系,以及人工智能最近这次热潮背后的技术驱动力和创投规律。以下是演讲全文。
刚刚大家看了创新工场相关的视频,里面有一家叫美图的公司。美图马上就要在香港上市了(12月15日,美图公司正式上市),这是创新工场投资的一个开始成长为独角兽的公司。
其实,美图也是一家AI公司,有非常多的可以用人工智能的地方,最典型的的就是人脸识别。除此之外,还有很多可以应用AI的地方,比如,传统的磨皮是典型的数字图像处理算法,但是不是也可以用人工智能技术来改进呢?让机器学习什么是最白最美的皮肤,什么样的磨皮方式和现在要处理的皮肤是最匹配的。这样,就能既做了脸部美容,又因人而异,保持每个人的皮肤和脸型特点。
美图有世界上最大的人脸数据库,也许其中女性脸部居多,但也因此有非常广泛的人工智能应用场景。在这样的创业公司里面,人工智能变成了公司的内在驱动力。而美图本身就是一个非常技术化的公司,美图上市后,会变成一个独角兽规模的公司,它未来的发展一定会不断引入新的人工智能技术。
所以,今天我想跟大家讨论的主题就是科研和创业的关系,它的核心话题是人工智能。大家都知道现在是人工智能的黄金时代,那科研里面人工智能的角色是什么?创业里面人工智能的角色是什么?人工智能如何从书本上跳到真实挣钱的公司产业,能够创造出许多既赚钱,又实现人生梦想的企业家和创业者呢?
我们先看第一个问题。
这个问题,我觉得对计算机专业以外的人和计算机专业内的人,对不懂机器学习的人和懂机器学习的人,得到的答案未必是一样的。而且我相信,即便是同样学计算机的人,即便是同样懂得机器学习或者深度学习的人,对于什么是人工智能,给出的答案也未必是一样的。
很多人说人工智能的时候,脑子里会出现一个像人一样的机器人。这个图景在科幻小说里比较常见,在科幻电影里比较常见。但不要把它想象成,仅仅是非专业人才会想象的一个途径,专业人为什么不能想象这样的人工智能定义?
专业人士天天看教科书,看数学公式。可是你看这些数学公式的时候,有没有想过,这些东西未来的某一年会不会突破某一个临界点?会不会让你做的一个程序变得真正和人一样聪明,甚至比人还聪明?如果你的答案是“会”,那么为什么?如果你的答案是“不会”,那么又是为什么?
我们完全可以从数学的角度,从计算机科学的角度去想一想这些理论上的问题成立不成立。我们应该建立一些相对比较科学的逻辑,就是当你去看待人工智能是什么时候,你应该有你自己科学的逻辑,有你自己科学的认识,或者说你自己科学的定义,然后从科学的角度,判断人工智能技术会不会突破临界点。
今天流行的深度学习技术是机器学习算法的一种。而机器学习从本质上来说,其实就是用数学或计算机科学的手段,对世界的局部或整体进行建模。如果世界简单到黑白分明,那一个简单的线性函数就能描述这个世界。但我们要处理的局部世界的问题总是越来越复杂的,因此就需要越来越复杂的算法、函数来描述这个世界。
深度学习之所以取得这么大的进展,主要还是因为深度学习提供了一种非常丰富的、非常有描述能力的建模方式。比如许多许多层的神经网络结构可以模拟非常复杂的世界规律。
学数学的、学计算机科学的同学不妨在脑子里做一个头脑实验:如果深度学习的网络结构是可以不断扩展的,那么,多复杂的神经网络才可以描述我们身边的真实世界?这一方面取决于实现深度神经网络的计算结构、计算能力是不是真的可以不断扩展,另一方面取决于我们如何理解这个宇宙的复杂度。
假设你的答案是,深度学习在未来可以通过不断扩展,达到描述这个真实宇宙的能力,那不用说,基于深度学习的人工智能算法一定会超越人类的智慧。因为人只不过是这个宇宙中的一部分,人的智慧也不过是建立在对身边这个真实世界的建模的基础上。当然,你的答案也可能是否定的。但这个头脑实验会是个非常有意思的实验。
当我们把人工智能定义成依赖于机器学习为主的技术,来拟合世界的一部分,就会发现,这样一个定义可以很自然地应用到我们的生活中。
这是一个手机截屏的图片,可以看到,这个手机上装了非常多的应用。
事实上,当我们在用手机的时候,很多常见的应用,已经嵌入了人工智能的特点和特性。比如说微软小冰可以跟用户聊天;滴滴出行、亚马逊购物这些应用里面的一些推荐算法都会自动推荐最好的产品,或给出租车司机安排一些最好的路线;而Google、百度这样的搜索引擎本身,事实上已经是人工智能驱动的了,无论是搜索结果的排序,还是搜索引擎智能回答一些人类问题,这背后,都是基于机器学习的人工智能技术
我们基本可以把人工智能的发展划分为三次热潮,每次热潮其实不太一样,但贯穿这三次浪潮的,有一个很有意思的现象,就是都有下棋这件事。下棋是人工智能的研究者最爱用来展示人工智能技术的一个领域。原因在于,一方面,下棋是人类智慧的一个体现,机器一旦在这个领域取得突破,所有人都会觉得很吃惊,另一方面,解决机器下棋的问题,涉及人工智能研究的许多根本性技术,像搜索啊,贪心算法啊,强化学习啊,等等。
五六十年代的人工智能大师在通用计算机刚刚诞生不久、计算能力还非常有限的条件下,纯粹通过数学或者非常原始的编程模型去实现他们心目中的人工智能。早在那个时候,那些人工智能大师就已经看到了下棋这件事。图灵曾在他生命的最后几年,在纸上写过一个可以实现国际象棋原理的代码,只是当时的计算机的处理能力不够,这个代码没有办法变成一个真正的可以与人下棋的程序。
实际上,五六十年代有一种比较适合当时计算机能力的棋类,叫西洋跳棋。计算机的西洋跳棋程序曾经在五六十年代战胜了一个人类的专业西洋跳棋棋手。虽说对手在专业级别水平也不算很高,但当时的电脑,你们想象一下,是什么样的,电脑处理能力又是什么样子。电脑战胜了人,所以在当时是一个小小的轰动事件,意味着人们已经开始关注人工智能。
当西洋跳棋胜人之后,人们会说,计算机好厉害,是不是要毁灭人类了。可没过几年,人们就会说,西洋跳棋太简单了,国际象棋这种才能代表人类智慧。计算机不是厉害么,那么你下个国际象棋试试?
后面的故事大家都知道了。1997年IBM的深蓝战胜世界棋王卡斯帕罗夫。那时候,我在读大学,那件事给我的震撼,给我们这些懂编程的人的震撼,一点都不亚于今年3月AlphaGo战胜李世石时带给我们的震撼。
可没过几年,人们又觉得,战胜国际象棋的计算机程序其实也算不了什么。我们人类不是还有围棋吗?今年3月以前,很多围棋培训班的老师都会对孩子们说,围棋是目前唯一一种没有被计算机攻破的人类智慧运动。可结果呢?
这种所谓人类的智慧游戏贯穿着机器的AI发展史,成为技术人员和普通人的认知能力之间的一个非常好的桥梁。你给普通人讲人脸识别,他最多会当作一个计算机的技能,就像所有的停车场都会识别车牌一样,他不会觉得这个东西有多困难。一张人脸,普通人只会把它理解成鼻子、眼睛嘴巴。很多不会下围棋的人,认为围棋也不过如此,但会下围棋的知道围棋的深浅是深不可测的。所以一旦计算机在围棋上赢了人类,那人类受到的震撼远远不是一般的技术超过人类所能够比拟的。
我讲历史,只是想告诉大家,人类是一个健忘的动物,也是一个喜新厌旧的动物。设想一下,过两年Alpha Go已经远远超过所有人类棋手,连手机上的围棋也可以轻松打败人类的九段,那时候人类还是会说,围棋算什么,围棋可不能算人工智能,这个东西太简单了,计算机必须拿出更大的本事来,才能被称作人工智能。
很有意思,人类就是这么嘴硬。当然,这也可以认为是普通人对于人工智能定义的自适应性,就是根本没有一个量化的标准。计算机智能在不断发展,但到底发展到什么程度,才是普通人心中的人工智能呢?这个尺子一直在变。
从技术本源上说,深度学习有好几十年的历史。但2006年,才是深度学习复兴的一个标志性的年代。这不完全是因为深度学习的鼻祖Geoffrey Hinton在这一年发表了那篇著名的深度学习论文,其实,在2006年前后,深度学习赖以发展的大数据、计算能力、移动互联网等等,都开始发展和成熟起来。
从2006年开始,业界慢慢具备了大数据的能力和计算能力。对世界建模的前提是这个世界要有丰富的数据供计算机来学习。但是在2006年以前,这个数据是非常非常匮乏的,这个世界拥有数据,但这个数据未必能够被数字化,或者未必能够数字化之后未必能够被收集起来。
那么2006年前后,产业革命发生了非常大的变化,我相信大家能够想到一些,一个非常大的要点就是搜索引擎,搜索引擎起到了把大数据聚合起来一个提纲挈领的作用,它把所有的网上信息都聚合在一起了。
另一个非常有标志性的技术进步就是移动互联网。移动互联网让我们每个人都可以非常方便地为这些大数据库来贡献数据。你在网上的每一次购物,每一次打车,每一次点击行为都会变成大数据的一部分。
有了这些大数据,也有了一定的计算能力,深度学习就有了用武之地,这是深度学习复兴的根本。
有人说现在人工智能这么火,这么多人给出高价来招聘人才,这么多创业公司这么多钱堆上去,这次的人工智能浪潮会不会又像前两次一样,马上就跌入低谷,没有后续了呢?
我们不是未来预测学家,也没法预测未来,但是我可以给大家一个我们创新工场的判断。
第三次人工智能浪潮和前两次相比,有着本质的不同,这是因为,在很多的垂直领域,人工智能第一次展现出来计算机能把一件事做到足够好的能力。
至少在语音、在视觉等垂直领域,计算机做的事情都可以超过人类的心理阈值。是否超过心理阈值,是人们是否接受你的产品,接受你的技术的一个前提条件。
比如语音识别,人类对语音识别的准确率一定会有一个心理阈值。一旦你低于这个阈值,不管你是低1%还是低50%,人们都会认为这个产品是没用的。只有你高于这个阈值,人们才认为这个产品是有用的。
至少在视觉领域,在语音识别领域,在深度学习工作得非常好的领域,第一次第二次人工智能浪潮的时候,这些技术虽然发展到了一定的高度,但是还没有达到人类的心理阈值。
而第三次人工智能浪潮非常不一样。
大家可以回想一下2014年这个时间节点,普通人大概是在2016年知道人工智能这件事。但科研界的人更多的看到的是科研数据上的突破。比如机器视觉,科研界通常用ImageNet视觉比赛的结果来衡量机器视觉的发展程度。恰恰是在2014年,基于深度学习的计算机算法在ImageNet上超越了人类,一下子将识别错误率降低到了比人类识别错误率还低的程度。
一张图片上有多少个人脸,有很多相对模糊或者相对阴暗的人脸,人可能都未必分得出来的时候,计算机就认出来了。在这种情况下,说明计算机在视觉领域解决方案达到的程度已经超过了人们的心理阈值。所以人一下就感觉这个东西有用了。
这是我们想说的第三次人工智能浪潮和前两次浪潮的本质不同。这个本质不同带来的结果是,计算机人工智能的程序,人工智能的应用真正能在商业领域开花结果,能在商业模式里赚到钱了。以前是拿人工智能“骗钱”的,现在是拿人工智能赚钱的。
所以会说从2006年开始的这样一个第三次人工智能浪潮,创新工场非常确信它会是一个产业革命,会进入一个稳健的发展、成熟期,而不是一个昙花一现的浪潮。原因就是我刚才说的,在很多领域,它已经超过了人的心理阈值,已经变成了一个可以用的算法或者说可以用的工具。
刚刚提到深度学习复兴,其实在人工智能的第三波浪潮,它做到了在多个领域超越人类的心理阈值,并开始创造商业价值。这些领域可能包括识别领域、自动化领域、互联网大数据领域。而深度学习,或者说人工智能正在解决这些领域里的问题。
如果说在这些领域里面比较一下,我们认为可能未来最大的领域是无人驾驶。
为什么说人工智能可以代替司机?
我不知道大家对人工智能或者说无人驾驶,是怎么预期的。是预期每天去哪里都有无人驾驶车来接你,还是会预期每个人家里买一辆无人驾驶汽车?
业界主流的判断会认为,无人驾驶会首先从一些限定领域进入我们的生活。比如说在美国,现在业界看好几个无人驾驶落地、产生商业模式的机会,其中之一就是货车运输。因为货车运输相比较来说有固定路线,同时对人类来讲,货车运输是一个非常艰苦的工作。货车运输用无人驾驶可以大大提高效率。
在美国实验过,把若干辆货车编排成一个车队,货车之间间隔2米或1米,然后在路上就像一个火车一样。只有最前面的货车有一个人类的司机帮忙监控一下,后面的货车都跟着前面的货车的行为来走,可以保证不会追尾,然后快速地把大量的货物像火车一样,从一个地方运到另一个地方。
所以这是美国人非常看好的一个无人驾驶的应用领域,但我觉得这未必是中国的第一个应用领域。中国有中国的特点,很多中国的无人驾驶公司已经在设想许多特定的领域,开展最早的无人驾驶商用化的实验。
比如说,在我们北大的校园里,先把校车做成无人驾驶。校车的好处是路线固定,范围固定,时间固定,就连校车能够遇到的交通标志和障碍都是已经确定的。那么在这个基础上,要解决的问题相对简单得多。
所以人工智能取代人类一定是一步一步的,绝不会有一天,你睡觉起来发现楼下司机全没了,全变成无人驾驶的,这是不可能的。当无人驾驶在生活中潜移默化地一步步取代你的时候,甚至你都感觉不到人工智能来了,你会说什么智能,不就是开校车吗,这不叫无人驾驶。
直到有一天,无人驾驶的出租车来接你了,你可能也未必觉得它是人工智能。这个例子只是告诉大家,就是人工智能会悄悄地成为我们人类的帮手,甚至在你无法觉察的时候。
但是对于我们专业的人来说,我们应该尽量留意这些事情,尽量去看到什么东西可以给我们创造机会,什么东西有潜在的商业价值,而自己应该在里面扮演什么角色。
其实,计算机的发展经历了非常明显的时代化。在每一个时代,只有一种技术可以主导,也只有符合时代技术潮流的公司才能生存下来。在1990年做人工智能,敌不过那些做PC和互联网的,但是今天就不同了。今天已经不是PC时代或早期的互联网时代了。今天,你能跟联想抢PC的生意吗,能跟戴尔抢显示器的生意吗,能跟百度抢搜索引擎的生意吗?作为创业者,必须在最好的时代做这个时代里最有机会发展起来的事情。
创新工场认为,当今时代的主流方向是人工智能。
未来5到10年甚至更长一段时间的主流是人工智能,如果你们有创业的理想,恰好又学过人工智能,那就处在了一个非常好的,也是非常有挑战的位置上。这个时代正在召唤创业者,这个时代正在召唤像PC时代的柳传志,互联网时代的李彦宏,移动互联网时代的王兴那样的创业者,来投入到人工智能的创业浪潮中。这个未来的创业明星,也许就在你们中间。
创新工场会把一个新兴的产业,比如人工智能,按照架构分成不同的部分。在不同的部分,会有不同层级的公司进行创业,从而搭建整个生态环境。这种划分是我们创新工场,用来指导人工智能投资的基本原则,在每一种细分领域,都有可能创造出很多十亿级别百亿级别,甚至万亿级别的初创公司。
一个最有趣的例子是Google。我在Google的时候很多事情未必看得那么透,但是我离开后,从局外人的思路看很多事情,会看到一些规划确实高人一筹。比如说,当年Google和百度一样都是在做桌面搜索引擎,但是Google是第一个从桌面搜索引擎提出了移动优先的策略,这为移动互联网打下了非常扎实的基础。同样的,Google在2011年就开始做谷歌大脑,在2012年就提出了AI First的战略,基本是走在了所有科技公司的最前面。
Google每一个产品,只要能和人工智能结合的,它都会选择结合。因为人工智能会在很多领域提供一些高级算法。在座的学过深度学习的应该比较清楚,深度学习的平台化是一个非常大的挑战。我相信在未来3年左右的时间,会有一个非常彻底的改观。因为很多公司包括谷歌在内都在大力地做这些方面的事情。其次呢,深度学习需要大量的数据,可能要百万千万甚至亿级数据,才能达到一个非常非常好的效果。但其实,有些领域根本就没有所谓的海量数据,更不要说大数据了。那反过来讲呢,深度学习这种对人类世界的建模方式,是唯一的建模方式吗?我觉得未必,在未来几年,大家可能会发明出更好的建模方式,去适应那些缺乏大数据的领域。
机器虽然在模仿人,但其实只是模仿人的一部分。人的学习有一个非常大的特性,叫举一反三。我们家孩子只有5岁,可是我清楚地记得他两岁的时候,我带他去商店里,看到小孩玩的那种滑板,他就看了一眼。然后过了很久,他又到一个场合看到了一个不一样的滑板,他马上就说,这是滑板。而计算机视觉程序,这些对象识别程序要学上百万张滑板才能辨别出来。这是计算机和人一个非常大的差异。
大家应该知道,现在正在研究的许多热门领域,比如迁移学习,比如少样本情况下的机器学习算法等等,就是让机器来更好地模仿人类的智慧,而不是必须有巨大样本量的情况下才能学到东西。
这是创新工场,为人工智能未来的发展和投资所画的一个蓝图。这也许是今天我的演讲里最重要的一张图。
这是我们对机器学习对深度学习,对人工智能在各个垂直领域,在不同的应用场景,几年内走向成熟,几年内走向产业化的一个预判。大家可以5到10年后再拿出这张图来看一下,看看创新工场的对未来的感知,是不是像当年对移动互联网未来的感知那么准。
这是创新工场目前在人工智能的布局。右边的方案是我们正在投资或者已经投资的人工智能的公司,这里面有很多公司已经发展得非常好。
比如旷视,美图,驭势,第四范式。说到第四范式,大家可能感觉名字比较奇怪,他们做的是商业智能,把金融行业的数据拿过来,帮助建立这些金融行业需要的各种模型。大家知道金融行业数据可能是现在所有行业里面数据最全,质量最高,同时是对数据的需求最大的一个行业。
创新工场实际上已经投入的人工智能相关的公司就有大概20家,同时在左边,我们希望利用新成立的人工智能工程院来做一些人工智能的早期研究和早期孵化。
对正在学习的和即将毕业的学生来讲,这都是一个好消息。如果你们想从事人工智能,如果有创业的打算,想赶上这波人工智能的大潮,那创新工场的人工智能工程院可以提供一个非常好的机会。
如果是毕业应届毕业生的话,可以以工程师或者研究员的身份加入,如果是非应届毕业生,可以申请实习。我们和从美国回来的大牛一起来搭建四五个小项目。每一个小项目,做人工智能领域的一个方向,包括自然语言处理,机器视觉,数据挖掘等。做项目期间,可以拿工资,可以接受导师的培养,不用定点上下班,只要完成任务就可以。在这里可以学习到足够的知识,也能够为科研贡献一份力量,还有可能走上创业的道路。
1. 问:你好,我想问一下,在教育领域的应用,可以怎么进行改革呢?另一个问题是,非技术背景怎么进入人工智能领域?
王咏刚:在教育领域的应用,我可以给大家举一些例子。我们创新工场投资的教育公司很多,有一家叫vipkid。美国的老师来教中国的小朋友,现在有3000多个美国老师,然后在美国老师和学生交流过程中,用的是一个视频教育系统。现在这种最基础的视频教育系统能够把两个人从美国和中国连接在一起,那么接下来呢?是不是应该利用这种虚拟的环境,让教学更身临其境?这里面有很多VR/AR以及人工智能技术的用武之地。
第二个问题,非技术同学如何参与其中,比如说创业,甚至说参与到工场项目中来。我觉得有两个层面的问题,一方面是非技术有没有可能转行做技术,我觉得这是有可能的。另一方面是说,如果你想在非技术领域从事创业又该怎么做,其实即便是一个人工智能公司,也需要商务落地,也需要商务人才,特别是在现有条件下。
2. 问:现在,比如说互联网,肯定有些好的项目就被大公司买掉了,包括BAT都在做很多尝试,我们做项目有什么优势呢?
王咏刚:非常好的一个问题。这个问题其实在创新工场内部也有争论,虽然我们看好人工智能是一个大势所趋,但是大公司小公司都在做人工智能,为什么小公司就一定会有更好的成功机会呢?
从历史角度来看会发现,实际上在每一轮的历史浪潮里,比如在互联网的时代,有百度有谷歌,但是丝毫不影响移动互联网时代出现新的公司。这是因为在每一个技术浪潮里,上一个技术浪潮的领军人物,他的企业重点,研究重点,或者研发方向未必能够快速转型,在新出现的热点领域里面,中小公司拥有大把的机会。
3. 问: 我一直想问一个问题,任何一项新技术出现都会变成一个非常严重的问题,就是安全问题。安全问题会不会带动安全产业共同发展?
王咏刚:我觉得这是两个层面的事情,一个是从技术层面,技术只是人类的工具,任何技术都不是非黑即白的,任何技术都有安全上的缺陷,需要其他技术或者管理手段来弥补。技术怎么被人类使用,这个才是安全的问题。我们都在用电、用汽车,但没人会问,用电或者用汽车会不会导致大规模的安全隐患。其实每个懂科技的人都可以用电来制造杀人的武器,也可以把汽车改造成杀人的武器。人工智能技术也是一样。人工智能和其他任何技术一样具有好的一面和危险的一面。我们必须研究如何使用人工智能技术,如何与好的应用模式、应用规范相结合,才不至于出现危险的局面。所以,安全专家会不断面临新的挑战,人工智能技术的发展也会反向促进安全技术、安全产业的相应的进步和发展。
思达派(Startup-Partner.com)转自创新工场,略有编辑。思达派系创头条(Ctoutiao.com)旗下智库,专注成为创业者(Startup)的成长合伙人(Partner)。