10 月 24 日,程序员们的节日,也是科大讯飞一年一度的开发者大会。
按照惯例,讯飞今年依旧选择在自家主场安徽合肥举办大会。这家 1999 年成立,已经发展 19 年的科技公司,如今已经是 AI 领域极具代表性的中国企业,大会自然也吸引了来自全球各地的开发者,近两年科大讯飞也在智能硬件领域不断推出产品,因此极客之选(公众号 GeekChoice)这一次也参与其中。
AI 技术落地一直是近年来科技公司不断关注的话题,各行各业面对 AI 浪潮也在逐渐转型。对科大讯飞这家从成立之初就以 AI 技术作为核心地公司来说,如何利用技术更好的赋能各行各业乃至人们生活更是需要不断尝试地目标。如同我们每天使用的输入法,语音翻译软件等工具一样,当这些技术融合在生活当中,才能真正发挥其潜在价值。而在这一点上,本次发布会带来的新的办公神器以及更进一步的「1024 计划」,则成为科大讯飞接下来的重要方向。
方便记录的办公神器:讯飞听见 M1
了解科大讯飞的人应该都不会否认这家公司在语音、语义识别和理解上的深厚功力,即便如今在中国围绕 AI 技术开展业务的公司越来越多,但科大讯飞却是极少数能在 B 端和 C 端方向持续输出产品的公司,这一切都让讯飞听见 M1 这款产品多了一些神秘感。
讯飞听见是科大讯飞第一款转写机器人。顾名思义,转写机器人就是能够将收听到的语音直接转写为文字,这样的工作在过去一般由速记员来完成,但讯飞听见 M1 似乎想要尝试挑战这一领域。
一般而言,当公司会议、记者采访、课程培训时,速记都是必不可少的需求,由一个人将听到的内容快速记录在大脑中,反应在纸和笔上,就有了语音内容的文字版,而从某种意义上来说,这件事情应该有更好的解决方案。
讯飞听见 App 就一直在做这件事,也许正在阅读的你曾经用过或者听说过这款语音转文字的应用,它虽然有时没有人工来的精准,但却可以解决部分燃眉之急,但受限于手机录音部分的基础限制,这样的应用还不能取代人工转写,于是就有了讯飞听见 M1 这款硬件。
从外观上看,这款圆柱形硬件外形不像是大多数人理解的机器人,而更类似于亚马逊 Echo Dot,但更加小巧,差不多有手掌大小,它的特别之处就在于内部的 7+1 环形麦克风阵列,通过麦克风阵列能够实现房间 10 米以内 360°方位的声源定位,配合内置的 24bit 拾音芯片,因此比起手机来说,无论拾音距离还是清晰度方面都有更好的表现。
讯飞听见 M1 正面只有一个录音/保存按键,在日常开会、采访等状态下,按下录音键开始录音,再按下按键立即停止。录音内容可以通过自带 Wi-Fi 热点或者自带 Type-C 接口同步到手机端讯飞听见 App/网页端讯飞听见,使用官方语音转文字的网络服务后就能完成转写。因此我们不妨把这款产品理解成一个录音笔,但值得一提的是,这款产品可以完成中文和英文的语音转文字识别,在一些有中英文混合的企业会议上,这款产品无疑能发挥其价值。
不过,要完成这样的取代人类速记的任务,光是收录更清晰的语音还不够,更重要的是足够高的准确度和快速的效率。在发布会现场,讯飞听见负责人王玮表示,讯飞听见 M1 是基于科大讯飞深度全序列卷积神经网络转写能力和 Dereverberation 去混响技术开发,目前中英文语音识别准确率能达到 95%,而且可以实现 1 小时音频 5 分钟出稿的要求。
实际上讯飞听见 M1 这款产品在前两天已经有不少媒体曝光,今天在发布会现场,见到实体我们得以进一步确认它的配置已经细节,目前官方售价 1299 元,这个价格虽然不算便宜,但如果如官方介绍所说有更高的效率和准确度,相信能够吸引到不少企业用户。
在技术落地场景这件事上,科大讯飞从 B 端逐渐深入到 C 端,无论是翻译机、转写机这样的工具型产品,或者是智能音箱、智能耳机这样的内容运营型产品,抑或是讯飞听见、飞鱼系统这样的平台型产品,多样化的产品正在构建其自身的产品矩阵,并更进一步夯实科大讯飞的产业融合力度,如科大讯飞轮值总裁胡郁所说:「不仅是核心技术,我们还需要产品创新、应用创新,和源头核心技术创新结合在一起。」
《1024 计划》:更多元触达的 AI 计划
以构建生态平台成长起来的科大讯飞并没有忘记自身的真正价值——开放,因此发布会上带来的「1024 计划」就成了另一大看点。
「人工智能拒绝神化」已经走到 19 年的科大讯飞明白在如今风生水起的 AI 浪潮之下,要想巩固扩大优势,独自前行并不可行,因此,才有了科大讯飞轮值总裁胡郁发布的《1024 计划》。
《1024 计划》包含了三大主要内容,AI 教引计划、AI 生态计划、AI 公益计划,胡郁表示,这三个方面是为开发者打造的提升计划,通过不同层面已经在逐渐进行,实际上也希望更多开发者能够加入进来。
首先,AI 教引计划类似于培养 AI 相关人才。目前科大讯飞成立的 AI 大学,学生已经超过 24 万,他们通过线上提供的超过一百节以上的课程能够掌握 AI 技术、AI 创业的各种内容,并且线上课内容也会不断增加,目前签约教授达到 55 位。
除了 AI 大学还有 AI 创学社,通过联合高校、在线交流等多种形式,目的是能够培养开发者,并提供技术和环境支持。
AI 生态计划中最重要的是 AI 生态沙龙,区别于 AI 教引的线上培养年轻开发者模式,AI 生态沙龙更集中在企业层面,通过连接投资机构,线下组织同行交流,既可以位投资机构和开发者搭建良好渠道,也能为 AI 创业带来更多可能性,胡郁称,这一项目过去一年已经有 13 个获得融资,总估值超过了 60 亿元。
AI 公益计划中包含的主要是方言保护和三声有幸项目。科大讯飞在语音和语音理解上不仅支持普通话,还针对中国各地方言进行识别,这正是基于方言保护项目才得以不断进步,如今在讯飞输入法已经拥有 23 个方言语音识别,其中有 8 个以上的识别正确率超过了 90%,剩下的都超过了 80%。
三声有幸则是为了帮助听障人士,通过科大讯飞的语音技术,联合合作伙伴音书科技,目前位 10 所聋哑学校的近 40 万名听障患者提供了文字语音相关服务,并且还为众多视力障碍群体提供语音合成服务,这些都是公益项目的重要组成部分。
将目光瞄准开发者、早期创业者以及弱势群体等不同群体,《1024 计划》无疑能为科大讯飞寻找更多未来潜在的合作伙伴和用户,也许正如胡郁所说:「人工智能给我们带来的不仅是交互的便捷,而且是情感上的依托。」但从更长远的角度来说,AI 技术的落地,要想成为人人皆可使用的暖科技,无疑就是要关注这些不同群体,无论是逐渐完善的硬件矩阵还是成果不断的软件平台,用更全面的服务和更人性化的视角对待社会,或许这才是 AI 真正的价值所在。