9月1日的百度世界大会上,身为“厂长”,百度创始人李彦宏的演讲无疑是重头戏,过来“取经”的人也是想听听Robin对下一代互联网的精辟预见。往年,李彦宏会预判几个行业发展趋势,但今年只有一个关键词——人工智能。而且讲法上也很有趣,因为深度学习、神经网络、语音交互、图像识别等等偏技术性的概念,普通公众很难感知到。所以,在百度世界大会上,Robin是从场景入手娓娓道来。其中提及最多的当属度秘。
为什么度秘会被李彦宏频频提及呢?这并不难理解,度秘是百度人工智能的“化身”,是装上“百度大脑”跟现实世界对话的人,同时也是百度搜索交互形态进化的下一个版本。虽然百度大脑代表了智力水平,是逻辑判断及表达能力的核心,但度秘作为与用户连接的接触点,反过来决定了大脑的学习能力和智力水平。恰恰因此,我们认为,度秘将给互联网全行业及未来的社会网络形态带来三大重大变化,并引发又一轮的行业洗牌。
变化一:度秘意在颠覆用户和流量入口
通常来说,在互联网行业里,存在着两种类型的创新,一种是渐进式的创新和改变,往往是线性、改善型的模式,存在明显的路径依赖,在延长线上进一步优化;另一种则是颠覆性的,直接取代传统模式和习惯,容易引发改朝换代的大震荡。很明显,百度投入重兵研发和推进的人工智能和典型产品度秘,就属于后者,意在颠覆用户的入口,并在交互方式、信息及应用服务匹配等方面,将我们已经习惯了的行为彻底丢掉。
这并不是臆测。9月1日的百度世界大会上,李彦宏一登场就甩出了这样的话。他给出的判断是,人们可能要离开移动互联网了,下一幕人工智能的时代将开启,这是移动互联网用户和流量红利释放完毕后的必然趋势。当粗放式的阶段性增长结束后,“内生式增长”就会出现,以度秘为代表的人工智能接的就是这一棒。带来的变化也不言而喻——在用户接入端重新洗牌,不仅仅是门户、APP等接口形态,就连百度自己的搜索方式也会进化,并引发新一轮的势力范围转移。
90、00后人群的崛起,行为习惯的转变,使得越来越多的数据也佐证了这一趋势。百度世界大会上,李彦宏透露,目前百度每日搜索请求中,有2.5亿的语音合成请求;人们与度秘的交互沟通中,有56%是通过语音识别或图像识别来完成的,语音和图像的交互正逐步超越传统文字的使用频次,成为人们表达需求的主流方式。甚至还有一些令人意想不到的行为,比如情感语音合成技术日益成熟后,在百度听小说的用户,每日人均时长从0.69小时增长到了2.21小时。这恰恰也表明了全新的交互模式更人性化、更接近人们的感官,成为器官的延伸,而不是有一个“中间层”的跳转。
无论是今年上半年的百度联盟大会,还是9月1日的百度世界大会上,李彦宏一直在不厌其烦地讲述着人工智能与度秘的故事。而对于外界所评论的“B(百度)正在被AT(阿里、腾讯)甩开距离”的说辞不理不睬。看似不正常,但却胸有成竹。因为在百度和李彦宏的眼里,营收或利润上的差距只是表面现象,这些很容易撵上,但一旦抓住互联网的大迭代和颠覆窗口,结果就很可能上演大颠覆的戏法。有强大人工智能技术支撑的度秘,也就担当起了艰巨的任务,玩的是提前布局的策略,是在提前卡位下一代互联网的入口。
变化二:度秘技术门槛极高,这种游戏大佬才玩得起
相比传统交互模式,度秘不仅是交互层的革命,背后更是人工智能、机器学习、深度神经网络学习等核心技术上的较量,前端是识别意图、场景适配,后端则是逻辑判断、信息与应用服务的智能匹配,以及前后端配合的学习、训练的过程。这也表明,相比过去单一应用形态上的创新,人工智能的技术门槛高了很多。一个明显的变化是,以度秘为核心的下一代人工智能革命中,具备入场角逐资格的玩家不会太多,大多数产业链条成员会沦为内容、应用等生态附属的合作方。
在人工智能领域,孰强孰弱呢?目前为止,百度的出镜率是最高的。核心技术方面,百度与谷歌、Facebook、IBM、特斯拉等全世界顶级选手“同框”。很多人想知道,度秘的“大脑”智力水平几何。在百度世界大会上,李彦宏从语音识别与合成、图像识别、自然语言处理和用户画像能力四个维度出发,解读了百度在人工智能、机器学习等领域的技术优势。
首先在技术成熟度方面,度秘的语音识别准确率达到了97%,几乎可以应对任何复杂的场景。智能语音技术涵盖了语音识别、语音合成、声纹识别、声学信号处理,同时采用了深度学习算法,能在24小时内对数亿百亿级的语料库进行实时计算、分析。同时度秘在图像识别技术上也正逐步走向成熟,可准确识别门牌号码、花卉、衣服、人脸等物体,并进入实用阶段。但语音与图像属于认知部分,相比而言,自然语言处理和理解能力的难度更大。这要求度秘拥有像人脑一样的逻辑推理与判断力,并快速响应,进行情感式的表达和对话。
其次是数据和场景的丰富。以往输入的信息仅仅是文本,度秘接棒后,可能是一句话、一首歌、一张图片、一个场景,这不仅仅是技术高低的问题,就如一个人的经验和阅历一样,拼的是“实战”中不断提升的认知、智力水平。按李彦宏透露的数据,度秘的大脑可能是世界上最大的神经网络,这个网络拥有万亿级的参数,百亿级的图像视频数据和定位数据,数十亿的搜索数据,能模拟人脑的工作机制,学习训练极其复杂的模型。
正是因为这两点,决定了人工智能时代的开启,会是一道分水岭。因为只有互联网界的大佬才有足够的技术、人才、资金和资源储备,同时才具备海量的数据和足够广度的场景覆盖。这些也表明,人工智能是典型的应用场景技术,存在极高的时间成本,抢跑所带来的优势更明显。只有在更多的应用场景下持续训练和学习,才能提升应用水平。一直以来,百度持续从硅谷挖来顶尖技术大腕,还不断推进度秘的落地和应用,就是这个道理。
变化三:人工智能将无处不在,应用和场景决定成败
就如上面提及的,代表人工智能的度秘,其竞争力取决于两点,既要天资聪明(技术实力强),又要后天持续的学习(场景学习和训练)。百度世界大会上,主题设定为“AI is the new electricity”,寓意就是给全行业赋能。李彦宏也讲了,互联网+会是新常态,人工智能技术是一种能力,只有这种能力开放出来,与各行各业充分融合和应用,才能加速改变生活和产业。所以说,人工智能必然会渗透进各个角落,无处不在,且应用和场景的戏码要更重一些。
恰恰,度秘就是百度大脑接入各个应用场景中“连接器”。之前,度秘已经进入了肯德基,应用于智能点餐领域,既解放了人工,又给用户提供了全新的消费体验。此外,度秘在定票、旅游等生活服务领域也已然成熟。在今年的百度世界大会上,篮球解说员杨毅现身,与李彦宏现场对话,就度秘首次在奥运篮球赛事中担当解说员发表评论。杨毅嘴里说的“深刻理解运动项目、现场响应能力及极具情感的表达能力”,无疑就是在强调度秘的场景适应能力,只不过,度秘跟人脑比,记忆力和计算力要超出很多。
值得一提的是,百度世界大会上,李彦宏还邀请百度钱包的代言人胡歌登场,现场读诗并进行语音合成,戏言将来胡歌只需要给度秘下指令,就能拍戏了。虽说,这些听起来有些不可思议,但却在未来很可能会实实在在的发生。试想一下,如果度秘与AR、VR甚至是MR、ER融合在一起,就势必会让虚拟与现实的界限更加模糊,想象空间也就更加大了。
毫无疑问,未来人工智能将无处不在,度秘也会成为每一个人、每一个生活场景下的智能助理,普适性会体现得越来越突出。更可怕的是,随着应用场景覆盖广度上的扩大和应用深度上的纵深发展,度秘将会上演马太效应,将门槛提得越来越高,让后来者即使砸钱也很难超越。这或许也能侧面反映出百度的野心——暂时抛掉外界对百度的众说纷纭,持续在人工智能领域投入,直至彻底革新颠覆,引领下一个智能时代。