作者:刘燕
过去一年,从技术向产业,有哪些值得记住的人和事?未来一年,AI 场景化落地还有哪些可能性? 8 位 AI 行业局内人,向我们讲了讲他们的故事和看法。
早在 2010 年加入百度时,王海峰就开始了围绕 AI 技术体系的「实践」。
在那之前,百度仍没有一个单独的 AI 基础技术部门。他陆续拓展自然语言处理、机器翻译、机器学习、语音、图像、深度学习、个性化推荐等技术方向,尽管如他所说,当时「其实也不明确能用来做什么」。
不过,去解锁如此多元的技术领域,也不是王海峰起初的职能定位,实际上,他是以自然语言处理专家的身份被邀请加入百度。王海峰从 1993 年开始专注研究机器翻译与自然语言处理,成就斐然,在自然语言处理与计算语言学领域顶国际学术组织 ACL(Association for Computational Linguistics)50 多年历史上,他是唯一出任过主席(President)的华人。
即便是在技术研究上「战绩优异」,他没有停止边界的突破。2014 年,随着转战业务部门,三年多时间,王海峰负责了百度核心的几个业务板块,比如搜索、手机百度、Feed 流……并在技术与业务互相协同的过程中,孵化促成了度秘等新业务。
那段时间,王海峰不仅迅速迎来个人在百度的两次晋升—— 2011 年升为基础技术首席科学家、2013 年进一步升至百度副总裁,也实实在在尝到了以技术突破带动业务产品的甜头。「我们凭借持续的技术突破创新让百度搜索始终处于领先,我们凭借技术的快速升级实现了 Feed 流量的高速增长,凭借技术的厚积薄发催生了度秘。业务需要解决的实际应用问题,以及业务中产生的大量真实数据,又促进了技术的继续创新突破。」
这让 2017 年王海峰再一次完成转身显得顺理成章。无论哪一个方向的变化,几乎都暗合了他在百度 8 年时间里的升级过程,怎么看也都是他熟悉的「战场」:
2017 年 3 月,百度 AI 技术平台体系(AIG)成立,在这之前,百度并没有一个部门把所有 AI 相关技术都整合统一在一起。原本并不相互独立的百度研究院和八个应用技术部门,有了明确的分工,前者面向基础前瞻的技术研究,后者由应用目标来牵引。技术之外,百度在人工智能领域更大的变化是对应用、平台和生态的发力,促成商业化的落地。
很明显,应用导向成为百度在 AI 这件事上的重点,而王海峰经历了从零开始打下 AI 基础、深入核心业务线的过程后,也再次回归基础技术,组建 AI 技术平台体系,就任 AIG 总负责人并晋升为百度 Estaff 成员(百度高决策层),成为百度 AI 战略的关键「局内人」。
以下是机器之能对王海峰的专访实录(机器之能做了不改变原意的编辑):
「重要的决定,第一步是加入了百度,第二步是除了百度让我做的自然语言处理,我还把 AI 一系列基础技术都建立起来了」
我们看到百度真正开始在 AI 方面体系化规模化的投入,应该是从 2010 年你加入之后。回看当时的情形,这 8 年时间主要经历了什么?
我 2010 年 1 月份加入百度,到上个月 8 年整的时间,我走过了三个阶段,从奠基 AI 基础技术,到负责核心业务,再回来组建 AI 技术平台体系。这 8 年,对公司的贡献、我个人的收获,都是很大的。
第一阶段,那时候百度还没有这种横跨的独立的技术部门,只有各个产品部门里的技术团队。当然,基础的数据中心这些肯定是横跨的。但 AI 类的技术还没有横跨的部门。我加入后开始着手组建这些部门。至少在中国的各个互联网公司中,这应该算是比较领先的一个布局。所以我在百度的前四年,就把这些都陆续建起来了,从 NLP 到语音、图像、机器学习、深度学习、个性化推荐,数据挖掘等。
这个阶段奠定的基础,使百度后来在人工智能领域既有先发优势,同时也有更完善的组织架构,有更深厚的积累。
但如果仅仅如此,我认为对一个互联网公司来说其实还是不完整的。互联网公司产品迭代特别快,数据特别大,而且都是来源于实际业务。所以,2014 年初,有一个契机,当时百度核心的搜索业务特别需要,我就转岗去负责搜索,做了三年多。
这三年多时间,我大的收获就是每天跟产品打交道,跟用户打交道,跟线上的各种需求打交道。同时,我一直在做技术,所以我也更清晰地知道,这些技术怎样才能更好地应用到产品里面去。
我这三年多的时间,第一年从当时份额大的 PC 搜索开始;到下半年,开始有所扩展,接手了商业平台、糯米技术平台等;2015 年,我们将 PC 和移动搜索进行了整合,这在百度历史上也是非常重要的一步。整合之后,我们就可以开始做更多事情,比如度秘就是在 2015 年诞生的。2016 年我的职责范围中又增加了手机百度、Feed 流等重要业务,凭借技术的快速升级,半年的时间里 Feed 的流量就涨了几十倍。
去年 3 月份又回到基础技术的时候,我已经带过百度现在多数重要的业务。业务中有什么实际应用问题急需解决,业务中产生的什么真实数据可供技术使用,新技术如何融合进原有的庞大系统,我都非常清楚。这些对技术的创新及应用都是非常重要的。
有从做技术到产品再回来负责技术这样一个过程,我会了解基础技术跟产品到底应该是什么样的分工协作关系,怎么样把基础技术做得既领先、前瞻,同时又能更好的支撑业务,不管是支撑现在的还是为未来做储备,都会做得更好。
这期间,你做过哪些现在看起来仍然关键的决定?
如果说重要的决定,第 1 个是加入百度;第 2 个是除了百度招我时希望我做的自然语言处理,我还把一系列人工智能技术方向都建立了起来;第 3 个是 2014 年初我去负责搜索;第 4 个当然是 2017 年 3 月组建 AIG。
事实上,刚加入百度时,公司并没有要求我把那些 AI 技术方向都建起来。初进入百度的时候,我的定位就是自然语言处理专家,希望我把百度自然语言处理完善起来。因为搜索引擎对自然语言处理的依赖非常重,比如用户需求分析、网页分析等。但我并未局限于自然语言处理,在我加入百度的第一个季度,就先后为百度开创了机器翻译、语音识别等对当时的百度核心产品价值并不大而后来又证明很重要的技术方向,之后又陆续建立了推荐及个性化、数据挖掘、图像等方向。
2012 年初,又有了很关键的一步,我们正式立项开始做深度学习,这在中国公司里应该说是领先的。当年,我们基于深度学习的语音、OCR 等系统先后都上线了。从大环境看,那时候我们真正要做深度学习是面临很大挑战的。我记得 2011 年下半年,大家逐渐开始知道深度学习,当时,国内一些做机器学习的顶尖学者举行了一个小型研讨会,会上大家的感觉是,想要把这些技术应用落地还很困难。当时国外有人曾经尝试过将深度学习用于语音识别,训练一次要半年,这种状态是无法大规模产品化的。那时候我也负责做语音,我们和做系统的同事组成联合项目组,既攻关算法,又优化系统实现,半年多的时间就上线了基于深度学习的语音识别系统。
2014 年初,我开始负责搜索,这对我职业生涯是非常重要的一步。要知道,极少有人有机会在自己的职业生涯中,负责年收入数百亿的核心业务。那之后的三年,为公司核心业务做了大量贡献的同时,我自己也得到了非常多的锻炼和成长,也为去年重新负责 AI 基础技术,打造更好更有价值的技术平台奠定了基础。
在你刚加入百度还没有一个明确的职责方向时,还是既做了翻译又做语音这些暂时不太需要的事,是什么驱动你这么做?
我个人的确有兴趣,比如我的前一份工作其实也是负责自然语言处理及语音技术相关工作。但是更重要的是基于两个方面的判断,一方面是产业发展趋势,另一方面是技术发展趋势。以语音为例。
先说产业,虽然当时主流是 PC,但手机已经展现出迅速变强的趋势。所以在我看来,手机迟早会成为主流。而手机是为打电话而生的,人与手机交互自然的方式就是对着手机说话,这为语音真正广泛应用打下了一个很好的基础,这是对产业的基本判断。
技术方面,过去很多年,语音技术在持续进步,每年错误率都在降低,有时候错误率相对降低 5% 左右,有时候好一点到 10%。积累到 2010 年前后,已经快要到突破的节点了。所谓节点,就是不断提升,过了某个临界点,相应的应用环境成熟,一定会爆发。基于这样一个判断,虽然当时我刚来不久,还是专门跟 Robin 做了一个汇报。他自己也很热爱和支持创新,很认同 AI 技术趋势,所以他很支持,然后就开始做。后来我们做很多事情都是这样的过程。
「要把学术思维和工程思维结合起来,先不管能不能说清楚,管用的就先把它做出来」
这些决策过程容易吗?百度已经是一个体系成熟的大公司。
在百度这个平台上比较容易,百度很看重技术,很鼓励创新,尤其是比较前瞻的技术创新。所以很多技术研究的开始都是如此,大概会有两个基本判断依据,一个技术发展趋势,一个产业趋势,这两个缺一不可。否则,技术做得再好,没有产业需求也没有用;反过来,产业需求有了,技术到不了,突破不了这个临界点,那也无法应用。在这样一个环境下,我们再做判断就不是太难。
一个技术的产业应用临界点,你是怎么判断的?
首先,技术不是说要做到 100% 准确才能用,效果达到一定程度,就好用了。比如语音识别,人也做不到 100% 准确。现在的语音识别技术,很多场景下甚至已经比一个正常人听的准确率还要高,这显然已经可以有很多应用了。我们当时开始研发语音识别技术时候,研究了搜索、地图、输入法等目标应用,分析了语音识别准确率到什么程度可以满足这些应用的需要,结论是努努力是可能做得到的。
所以说,在合适的时机找合适的应用很重要。找应用的想法并不是我首创的,一直就有很多人有这种认识。我们前段时间引入了几位世界顶级的科学家,其中有一位也是研究自然语言的(Kenneth Ward Church)。他比我年纪还要大一些,1993 年我刚入行的时候,就看过他的文章,当时有一篇文章叫 Good Applications for Crummy Machine Translation,那时候机器翻译效果比现在差很多。但即使如此,也可以找到一些合适的应用场景,也能发挥很多作用。
内部在决定要进行或者是开展一项技术的研究,是怎么往前推的?
有两方面,一些是从应用来的,也有一些暂时没有应用。我们看好某些前瞻方向,就会提前布局去做,尤其是越往底层,比如说研究院,不需要有一个直接的应用来牵引,但是我会有一个对未来的预测,认为未来这项技术会很有用,那我们就会提前布局。
你刚才也提到 2011 年下半年国内才开始有人讨论深度学习,具体是什么样的状况?
那时候产业界基本上没人做,学术界基本上也是处于起步的状态,刚刚开始接触和测试深度学习这个概念。我们召开一些研讨会,大家一起讨论讨论到底是怎么回事。所以基本上也没有相应的人才。当时我们要做深度学习,也就是拿一些国外早期发表的几篇 Paper 看一看。Paper 上看不清楚的,就只能自己去摸索了。因为 CPU 训练太慢,我们联合做系统的同事一起搞 GPU。那个时候谁也不懂,就自己想办法搞清楚 GPU 编程到底怎么编,就是这样逐渐做起来的。
在外界这种状态下,百度内部对 AI 或者是对这些细分的技术方向有特别明确吗?
那时候没有那么明确。当时我们建一些技术方向,大家还是从各自产品角度提出有哪些需求,看这些技术是否对产品有用。那时候没人提 AI 这个词,不像现在 AI 已经家喻户晓,我们初在语音领域做深度学习,公司大多数人还不知道。
其实那时候我自己也在反复思考,深度学习为什么会起作用。我们搞研究特别希望把数学原理先搞清楚,推导出来。深度学习有一些东西,其实在当时看来还说不清楚。所以一定要把学术思维和工程思维结合起来,先不管能不能说清楚,管用的就先把它做出来。
当时有这么一个空间给你不停地去尝试?
这个空间是有的。
2010 年到 2013 年,建立了这些不同的技术方向的部门。这些部门以及这些人,比较大的变化是怎么样的?
部门更成熟了,积累更深厚了。如果说,早期是先把这些基本的技术都搭起来,基础的数据收集起来,能支持一些应用先做起来,现在这些基础已经很强大了。
比如 NLP,NLP 是我来百度之后建立的第一个部门,现在技术、数据及平台的积累都已经很强大了。NLPC 技术平台,每天公司内部的调用量就是千亿规模。在这种情况下,我们一方面持续加强技术平台,另一方面也会为一些重要应用进行定制化技术开发。此外,我们也更有基础去做些更前瞻的、未来的东西,例如通用对话系统、通用人工智能方面的探索。这些看上去离产品应用没那么近,但在百度我们一直有这个追求,再往前多看几步,持续探索通向未来之路。
团队方面,无论是人员能力还是数量,都已经比当年要强很多了。当年那些刚入门的小同学,现在都成顶梁柱了。
转岗去负责搜索相关业务,涉及到的多半是产品,对你来说是挑战吗?
我是技术出身,其实一个纯做技术的人转到业务上,挑战还是很大的。但是我觉得我还是具备做业务所需的一些重要素质的,推动力和执行力都很强。这就是为什么我从纯做技术转到负责业务也能顶得住。
我接手搜索以后,和以前的确是不一样。我记得一开始,Robin 就问我,你怎么保证这个能做好?当时其实压力也挺大的,包括很多竞品追得很紧。我说人家要做,这个我是挡不住的。但是我会保证,我创新的速度更快。因为我技术积累多,我知道做什么会更快,能不断往前跑。这样的话,别人是追不上的,而且别人要一直追着我们,其实后很容易乱掉他们自己的节奏。
做了一段时间以后,我更坚定了,我发现这样做是有效的,很快就见到效果了。2014 年初,百度搜索引擎虽然局部已经用了不少机器学习技术,但在主体上还是一个传统的、以规则为主的系统。我们迅速地持续不断地推进技术改造,直到现在每个模块都是 AI 技术在支撑。我也发现,用 AI 技术改造搜索的同时,也能衍生出一些其它东西来,这就是后来度秘诞生的原因。
在 2014 年底,我们搜索团队曾做过一次讨论,讨论搜索的未来到底是什么。当时我们就认为,搜索就是不断地满足用户需求,我认为一个比较终极、自然的状态,其实就是一个像人一样的秘书。比如说你有一个秘书,什么问题,任何事情你跟他交待一句,甚至有一些你不用交待,他很了解你,你什么都不说,他可能就替你办好了。这就是为什么后来会有度秘,会有小度机器人。相当于做搜索这条主线的同时,衍生出了面向未来的旁线开始做。
「AI 会渗透到各行各业,会渗透到我们生活的方方面面,社会的每一个角落都会有」
在具体场景里,什么样的产品才是好的 AI 产品?它能更好地把技术和用户体验结合起来。
AI 产品已经真实存在了。搜索引擎就是一个典型的,而且是一个大的 AI 产品,规模极其庞大,里面有大量的 AI 技术。我们做的几乎所有的 AI 技术都会用在搜索引擎里,所以搜索引擎和以前相比也变得越来越不一样。
度秘、无人车更典型了,它们和搜索引擎不一样。搜索引擎诞生的时候,人们并不把它看作是 AI 产品,后来我们把它逐渐演化成这样了。而度秘和无人车从诞生的那一天起,就被认为是 AI 产品。信息流背后也是 AI 技术,要对用户进行理解,对内容进行理解,将内容和用户做匹配进行个性化推荐,所有这些事情都是 AI。
除了百度一直在做的用户产品,我们现在也开始做 to B 业务,综合利用我们的 ABC 能力(AI、Big Data、Cloud)为客户赋能。例如,首钢应用集成了 PaddlePaddle 及计算机视觉能力的 ABC 一体机进行钢板质检。再如,几个学生基于 PaddlePaddle 平台开发了智能桃子分拣机。AI 会渗透到各行各业,会渗透到我们生活的方方面面,社会的每一个角落都会有。
百度发布小度机器人、DuerOS 平台商业化速度非常快,业务线的推动过程还挺快。
对,我认为这取决于两个因素,一是前期做了很多积累,很多东西虽然不止我们一家在做,但这些积累我们是独一无二的,尤其是基于搜索平台方面,还包括语音、自然语言处理、知识图谱等。另一方面,我认为去年我们制定的开放平台生态战略,是非常重要的。不管是 DuerOS 还是 Apollo,基本上都是这样一个战略,我们提供核心、基础的东西,推动合作伙伴一起共建平台,让生态繁荣起来。跟平台伙伴的合作,我们比较灵活,有各种合作模式。比较独立的就是 DuerOS、Apollo 两个平台,而更庞大、完备的能力输出,是我们的 AI 开放平台。去年 7 月份开发者大会的时候,我们公布说百度当时有 60 项能力开放,这个数字现在变成 90 多了。
这背后的基本理念是什么?AI 是新的生产力,我把它比成第一次工业革命的蒸汽机,第二次工业革命的电,第三次工业革命的信息。不管源头是从哪个行业出现的,比如说第一次工业革命很大程度上是从纺织业,在 18 世纪是非常重要的产业,后都会渗透到各行各业。后来电更不用说了,各行各业都开始用电。人工智能也是一样,人工智能之所以从互联网开始,首先是因为互联网行业应用场景特别多,有各种资源、人才、数据、计算能力,这些也是人工智能发展需要的基本要素。
但是它肯定不止于影响互联网,现在我们也看到了,各行各业都开始引入人工智能这些能力。这种情况下,任何一个公司都不可能把它完全包办了。从这个角度讲,我们也必须把这些能力开放出去,让很多合作伙伴一起,应用在他们的业务里面,一起让人工智能迅速在各行各业都开花结果。在这个过程中,我们支持大家做了这些事情,大家都是受益者,终会共赢。
现在有多少开发者、合作方使用AI技术平台?
去年 11 月份的百度世界大会,我们宣布是 37 万。这个数字增长非常快,我刚刚看到新的数字差不多 50 万的样子,去年 11 月到现在两三个月的时间,又增长了十几万。
刚提出要做这个平台的时候,你们对这个平台的想法是怎么样的?后来确定下来之后有变化过吗?
开始的时候只有大方向和一些基本做法,肯定要在过程中不断优化的。比如说开始时开放技术没那么多,我们也会讨论到底先开放哪些,后续的节奏怎样。开放出去以后,是不是就够了呢?也不见得。一方面,我们会继续改进已开放的技术,另一方面也会不断丰富各种支持,比如为了让用户更好地理解和运用这些能力,需要提供丰富的应用实例,也需要有相应教程和培训等,为此我们也组织了 AI 训练营等。这些都是在逐渐迭代完善的。
迭代。所以其实做开放平台这样的事情,与做一个用户产品相比,有很多不同的挑战。
对,更确切的说这是不同角度的挑战。产品就是不断满足每个用户的需求,平台是一个个合作伙伴和开发者,他们的要求肯定会有不一样的。
平台类的发展方案或路径,怎么样判断,或者说有什么标准去判断它是在朝着一个好的、对的结果走?
产品就看是不是受用户欢迎,是不是用的人多,留存率是不是高,等等。平台也一样,比如开发者数量是不是越来越多,在上面开发的应用是不是越来越多,大家开发使用时的易用性怎么样,是不是有很多需求我们仍然满足不了?其实一样可以有很多指标可以去去衡量。
AI 技术开放平台、Apollo,还有 DuerOS 之后,接下来也会继续再逐渐开放其他的技术方向平台吗?下一个会是什么?
还是沿着两条线来说,一个是技术上,开放数量从 60 涨到 90,今年还会继续增加,这是沿着技术线上。Apollo 已经不完全是一个独立的沿着通用 AI 技术线的开放平台,而是在汽车这个领域深挖,DuerOS 也类似。在垂直方向深耕,开拓一块大业务。这个方向有了 Apollo,DuerOS,是不是仍然有下一个?我们肯定会去持续探索。
刚刚提到的 Apollo、DuerOS 平台,这是百度把开放赋能确定为 AI 时代核心战略的一个结果,所以这个战略在落地方面有别于他人的基本方法论是怎么样的?现在所有人都在谈开放、搭平台。
对于平台来讲,每一个单项能力够强很重要,而综合能力够强、够完整则更重要。我们现在也看到,我们的很多合作伙伴,他们需要的 AI 能力,普遍都不是一个单点。
比如某公司说需要一个语音识别,另一家需要一个人脸识别,还有一家需要文字识别,实际上常常不是这样的。很多应用都是需要把很多技术放在一起用,都是综合应用。企业往往不是说需要什么技术,而是说要解决什么问题,需要一个完整的解决方案。这种完整的解决方案,里面包含方方面面的技术,不止是识别,可能还需要理解,这就需要自然语言理解,还需要知识。我们给运营商做自动客服,相当于客服机器人。这背后涉及到语音的识别、合成,涉及自然语言的理解,对话的能力,还包括知识。知识既有我们通用的知识图谱,又有具体行业应用自己的知识图谱,甚至是业务流程。这一整套东西都有。
另一方面,你还得有工程落地的支撑,需要有这样的能力。百度云是一个能落地的很重要的平台。当然我们也不止是云上,端上也有一些这样的能力。所以 AI 的公司有不同的类型,每种类型有它自己存在的价值。但是我对这个趋势的看法是,很多技术真正应用的时候,关心的都会是解决一个应用问题,它会是很多技术,很多能力的综合应用。
很多技术真正应用的时候,大家关心的还是如何解决一个问题,它会是很多技术、能力的综合应用。能举一个具体的案例吗?
我们遇到任何一个任务,我们都需要先分析这个任务的本质是什么,包括分析用户的需求,这个任务相应的数据的特征和分布等。这样才能选择更好的方法去解决它。例如,现在语音是人工智能很重要的一个方向,但传统语音领域,比如你做语音识别、语音合成,会在云端训练一个大模型。现在我们真正要解决 DuerOS 的各种应用,实际上很多问题已经不是传统意义上有一个更好的深度学习模型就行了。实际应用中会有很多问题,例如唤醒的识别率及误报问题,噪声问题,麦克风的数量及布置方式,腔体结构等。所以真实场景下要把一个产品做好,有很多方面的问题要解决。
组建完善 AIG 的同时,百度研究院招揽行业顶尖人才也有进展。你对 AI 技术平台体系发展的设想跟接下来一个明确的目标规划是怎么样的?
这个体系,就是作为百度 AI 技术的平台,我们首先当然还是希望保持 AI 技术的领先。不管是现在业务需要的应用技术,还是对未来的布局,我们希望持续地往前走,持续地研发领先的 AI 技术。另一方面,我们要积极应用 AI 技术,不管是公司内还是公司外。公司内我们支持公司的各种重要业务,支持方式又分两种,一种是平台化的支持,一种是定制化的支持。能力越来越强,平台化支持业务的比例也会提升。持续提升的话,单位资源支持的业务会更多,同时重要的业务我们会以定制化的方式支持。对外的目标,就是我们的平台生态战略。同时,对于一些重要的合作伙伴,也和内部的机制类似,会有定制化的支持,双方一起联合开发。
整体上从技术到应用,就是这样一个逻辑。当然,要做好这些事,我们就要保持一个非常强大的,好的团队,这也是刚才提到的我们在招揽人才。外界看到了我们发布的引进顶尖人才的信息,我们内部的人才也在不断成长。无论外部引进还是内部培养,都是在持续进行的。
你认为根据你想要做到的事情,需要有一些改变吗?比如说人的配备,或者是说架构上,还有一些部门之间的协调。
如果说改变,肯定持续会有。组建 AIG 到现在不到一年,其实已经有了一系列变化。这个变化随着技术的发展,业务需求的发展持续会有,但不会有大的波动。虽然有时候外面看到我们的某一个动作会觉得惊讶,但在我们看来,很多事都是水到渠成的,发展到那一步,就是要有那个变化了。
技术部门更强化技术的产出,一方面会有定制化,另一方面也会强化平台化的能力。相同的人力资源下,我们能支持的业务方向,会随着平台化能力增强而增加。因为很多业务不需要专门投入人力,直接调用平台上的技术就行了。
另一方面,研究院也在加强,上个月刚刚宣布新增加了两个实验室,而且大家可以看到,增加的思路是有变化的。之前 IDL、BDL,包括硅谷的 AI Lab,更多是以技术来命名的,就是深度学习、大数据、AI 技术。新增加的两个实验室应用色彩更重一些,一个是商业智能,一个是机器人与自动驾驶。这是因为在我们看来,偏前瞻基础的几个 Lab 做得不错,但我们同时也会强调应用导向。我们做商业智能,做机器人、自动驾驶,其实都是沿着这个思路在把研究院建得更完整。
「管理上有所为,有所不为,而且在不同阶段要有不同的所为和不为」
你其实一直都是负责多条业务线的,不管是早的第一个阶段四年的时间,不同的技术方向,后面又是不同的产品业务方向,现在同时还要推进一些前沿技术的研究。你怎么平衡多线不同的任务?
因为不是我一个人在战斗,我有团队。我每往前走一步的时候,后面那些事情都会有人给顶起来了。否则的话,我的精力已经被耗干,我不可能再开辟一个新的方向。这个过程当中,团队的培养是非常重要的。我希望每一个位置上不断有人,有非常强的人能独挡一面,能顶住,而且他还有接班人,还有后备,每一步都是这样的。因此,虽然我负责的事越来越多,但每条线上都有一群很强的人,那些人都能独挡一面。这时候我才有可能不断的去开拓新的方向或者新的业务。面对新方向或新业务,对我来说,除了选方向,定目标这些事情,非常重要的也要把团队搭建好。团队无非或者是自己培养,或者是引进。我们的团队,的确引进了很多非常顶尖的人才,但如果你要算比例,百度自己培养起来的肯定更多。
你的管理风格是怎么样的?
首先我认为,团队也好,业务也好,或者甚至一个公司,如果出问题,很多时候其实都是在管理上出了差错。管理上有所为,有所不为,而且在不同阶段要有不同的所为和所不为。
初期的时候,我把目标定得比较细,会把团队各方面都理好。后期团队已经运行得比较成熟了,我开始往后退。退的意思是我抓重要的,宏观的事,甚至我选好几个重要的人,盯一盯,其他事我就可以适当放手了。
这样我才可以做更多事,还有很重要的一点,只有充分授权,真正做事的人才有发挥空间,才有更大的积极性,才会快速成长。我一直强调,做管理除了把事要做好,特别要强调人的培养。如果下面的人没有成长,我自己也不可能再往前走,也没法做更多的事。
百度还是非常典型的技术工作者的方式。
我们总说「简单可依赖」,外边可能有些不完全理解,但是内部我们的确就是这样一种模式在工作,也就是讨论任何事都力求简单直接,有问题直截了当,就事论事,谈论问题,解决问题,基本上这个效率是很高的。
「AI 其实是一个进化的过程,不是一个简单的训练过程」
之前你在一个采访里面也说到,在每天数十亿次的用户请求千锤百炼之下,百度的人工智能技术已经是真正实用的人工智能的技术了。什么才叫真正实用的 AI 技术?
如果要用一句话说,真正实用就是真正能解决某一个应用问题。为什么我说我们在千锤百炼下就更能解决这些问题?因为那些技术每天就是在解决各种应用的问题。像搜索里面,用户虽然终看到的就是一个非常简洁清晰的结果,但背后要解决的问题非常多。每一项技术,都是在具体应用问题上打磨,然后在真实的数据上训练,随着我们的应用越来越多,数据越来越多,训练的模型也会越来越好。同样一个算法,可能我们相配套训练出来的模型就是更好的。同时我们也积累了很多真实的解决问题的经验,比如说同样一个问题,我到底选择什么样的算法?怎样调节这个模型,甚至怎么样筛选数据?如果仅仅懂算法,是不足以把这些事情做好的。而现在我们因为有开放平台,同时也服务了很多合作伙伴的需求,我们也看到更多问题,这本身就是一个迭代进化的过程。
所以我认为 AI 其实是一个进化的过程,不是一个简单的训练过程。传统上我们搞人工智能是,有算法,有数据,有训练,训练出一个模型,就完成了,这是静态的。但在我看来,更多的是我们的 AI 系统在实际场景中去用,用的过程中,跟应用、跟用户去互动,数据也会不断增加,在这个过程中整个系统的模型、算法会变得更好。这是技术在场景里进化,不断改进的过程。这个过程不是闭环,而是进化,我不认为 AI 是在这样一个环里,它会不断地往前走。
你近比较关注的一些技术点都是哪些?有哪些产业应用方向是你比较看好的?
AI 涉及到的技术非常多,就像我们刚才说到的算法、算力、数据;有感知层的,语音、图像、AR 等等;认知层的,自然语言处理、知识图谱、用户画像等,每个层面都会面临一些不同的问题。
比如说数据层面,你可以说它是技术的一部分,也可以说它是独立的,但跟技术是高度相关的。数据首先就是怎么样能收集更多的数据,更有效地去处理,更有效地去挖掘其中的价值。理论上来讲,在其它资源都是无限的情况下,数据越多越好,但现在其它资源毕竟不是无限的。
同时,计算这部分也有很大变化,从 CPU 到 GPU 再到 FPGA,以及现在各类定制化芯片。在我看来,会有越来越多种计算平台,异构计算会很重要,同时边缘计算也会很重要。人工智能很多东西早都是跑在大服务器上,但是现在越来越多需要能在端上计算,所以算力方面,我们既要重视云的能力,也要重视端的能力,这是非常重要的一点。
感知层方面,过去这些年,深度学习这波浪潮首先是在感知层,像语音、图像这些领域获得成功的,同时这些领域也是受深度学习带来的红利影响进步大的,基本上已经达到实用的水平。接下来要做什么?实际上更多会跟硬件去结合,跟传感器、摄像头、麦克风等结合,总之软硬结合会变得越来越重要。
认知层上,深度学习带来的提升还远不如感知层。这其中一个本质的原因,我认为是,用深度学习技术解决语音、图像问题的时候,更多还是把它当成模式识别的问题来解决;但认知层的问题,远远大于模式识别。比如你讲一段语言,语言背后有丰富的涵义,语言是人对整个真实世界的认知、描述和表达,跟物理世界、人的精神世界、背景知识都是相关的。这些东西如果不具备,仅仅把它当成一个字符串用模式识别的方法来处理,可以解决一些问题,但是没有办法解决本质问题。所以到目前为止的深度学习技术,或者说人工智能技术还不足以完全刻画所有这些背后的东西。
人类的语言是可以去描述整个真实世界的。反过来,理解人类的语言,理解整个真实世界,要难得多。所以这也是我们为什么重视知识,花很大力气做知识图谱的原因。百度的知识图谱到目前为止是我所知范围内大的,有几千亿事实在里面,这是别人谁也没有的量级。我们在这方面的优势来源于百度传统的一些优势,比如说搜索,搜索把互联网所有的网页抓取回来,进行分析处理,并建索引。搜索引擎基本上构成了整个互联网的镜像。而由于现在大量的需求和数据在持续不断的线上化,互联网又构成对真实世界的镜像,所以透过搜索引擎的这些数据,我们可以从中挖掘知识,对整个真实世界更好地建模,更好地进行知识的积累。我认为,有这样一个过程,认知层的技术才能逐渐往前走,朝着通用人工智能发展,这是很重要的一条路径。当然通用人工智能还是比较远的一件事。
现在国内的学者或学生发论文的数量越来越庞大了,有人也会觉得国内的比如说自然语言处理,跟美国的距离缩小了。你怎么看?
首先差距是不是在缩小?肯定是在缩小,甚至有一些方面,我们已经反超。尤其是在应用技术领域,有些我们做得比别人更早。以机器翻译为例,现在主流都转到神经网络的翻译上了。我记得 2016 年 9 月底,Google 发布了他们的神经网络翻译。但是你上网了解就会发现,百度的神经网络翻译 2015 年上半年就已经上线了,比 Google 要早一年多。有些领域,我们的确是世界上早开始的,对科技圈来讲,早一年多是一个很大的领先优势了。
但我们的基础研究还是相对落后的。比如现在这些主流的方法,深度神经网络、强化学习,还都是来自于欧美。我觉得现在越来越多的中国人进入这一行,越来越多的人在做研究,我相信慢慢一定会产生好的基础研究。但是到目前为止,我们的确还是落后的。
我们在看技术领先性时,会把它区别为一些问题是属于基础性的问题,一些问题可能是在应用的过程当中发现的。
是,解决应用的问题我们能力已经很强了。
但大家会有一个观念是,后面这种研究能力是弱于基础研究的。
不能说谁强谁弱,而是有一个先后关系的问题。就是说你没有基础研究,后面也不可能用它们来解决应用问题。但是只有基础研究也是不够的,类比一下,比如说爱因斯坦的确很伟大,相对论也好,质能方程也好,的确是非常重要的基础。但是有了这些,离真正造出原子弹,建成核电站还差得很远很远,中间还有非常长的路,这些应用之路其实也是非常重要的。而且一旦这些路走通了,走到应用了,大家看到应用的价值了,会有更多的人进入,会有更多的资源进入,会反过来再促进基础技术的发展。所以应用非常重要,在现实场景下能发现问题并解决掉,很多时候也是在找新方法。大家都已经看到它的重要性,大量的人,而且是聪明人都进来了,中国在这方面迟早会有突破。
机器之能开年对话
8位AI行业局内人讲述对过去、对未来的看法官方微博
官方微信公众号
官方百家号