\

大家早上好,非常高兴能够来到上海参加今天的TRACKER创新大会,今天的主题谈的是辨认创新。

关键词如果是创新,怎么样去辨认的话,当风口来的时候,所有的人都知道风向哪里吹,而风没有到来的时候就需要我们去辨认了。我觉得更重要的是要去坚守,科大迅飞最近在资本市场上的表现是低调,缺点是特别低调。我们是99年创业的公司,08年上市,现在是亚洲最大的智能语音的公司。最近在投资界非常多关注到我们的进展,无论我们是被纳入了MISCI的指数,还有MIT最新的报告,其中中国9家公司,大陆7家,台湾两家公司,它纳入了前50名最具创新能力的企业,科大迅飞是在世界处于第6,中国第1的位置,这样一个榜单就说明了我们在人工智能第三次浪潮来的过程当中,中国已经参与其中了。

今年2月份我在纽约参加财富论坛和全球500强企业的高管进行对话的时候,当时他们的联合主席就问我,今年2月份我们的纽约时报做了一个报道,其中提到中美人工智能领域上的竞赛,已经上升到了一个军备竞赛的高度了,你是如何看待这件事的?其实我当时就告诉他,中国在这轮的竞争当中,我们在源头技术创新上,行业大数据的积累上,以及在行业专家的各种表现上我们已经具备非常好的创新条件了,我们会有一个在认知智能领域上重要的突破,和美国同样是进入无人区,我们希望在中国这个市场上把AI加应用做到更好。

全球人工智能产业实际上现在进入了非常关键的窗口期,16年美国白宫发布了国家智能研究与发展策略规划。2017年国务院引发了新一代人工智能发展规划。其实是把人工智能作为国家研发的发展战略。

中国在客户中心和效率提升上,在美国、在全球的创新中都起到非常好的作用,我们在中美能力的对比上可以看得到,无论是论文数量还是质量都处在相对非常好的物质了。在人工智能新的认知的区域,我们已经进入了一个无人区,我们都需要很多的力量一起探索。

我想在人工智能这个非常多的趋势已经从我们的实验室,从产业界进入到寻常百姓每个人的生活当中的时候,大家就会看到人工智能真的离我们越来越近,而且来的非常快。科学杂志认为到2035年人工智能会取代人工劳动50%,而中国是77%。这当中我们认为最重要的是掌握核心源头的创新,如果在核心的算法和技术上进行突破,掌握未来的可能性就越来越大。

我们从发展路径来看,一方面是DN为代表的神经网络算法的进步,在这点上越来越多的技术进步才使得我们的应用成为可能。第二类是脑科学和脑科学研究,国家成立了工程实验室,我们非常著名的语言和语音处理的国家工程信息实验室等等,我们从这两个方向往上走。

 \

我们选择辨认创新的,我们辨认语音是一个非常好的方向,以语音和语言为入口的认知革命是我们一直探索的路径。99年我们刚刚创业的时候,我们其实在刚刚开始是颗粒无收的,到2004年的时候才开始实现盈亏平衡,这个过程当中其实有很多人动摇,但是我们在01年的时候,创始人团队做了一个非常重要的会议,并且达成共识——

第一,我们继续选择以语音和语言为入口的人工智能方向发展,我们认为未来会有非常广阔的市场空间。第二,我们认为要做就做到中国最好,全球最好,技术一定要最牛。第三,这是我们非常热爱的事业,如果你热爱就和我一起去坚守,就是这样非常简单的信念,所以科大迅飞目前前30位的创始人团队目前没有一个人离开,大家都是非常热爱的心态在坚守。我们一直在做语音和人工智能结合的路径。

可以看得到,在14年的时候,中国的科技部就发布了首个中国人工智能的项目,叫类人答题计划,我们开发了讯飞超脑,这样一个神经系统无论在美国、欧美还是日本,都是用考试的方式对你的人工智能进行一个验证,我们的目标是在2020年让我们的机器参加高考,并且考上一本,这就意味着机器拥有人类前20%的能力。

 \

我们可以看到,很多人问你们是做什么的?我们做的是让机器像人一样能听会说,能理解,会思考。首先我们看一下语音合成技术,就是让机器像人一样说话,刚刚那条宣传片谈的是人工智能从1956年开始到今年61年波浪起伏的历程,以及中国的企业如何参与到这个过程当中来,那条片子的配音也是我们的机器配的,可以合成人的声音说话。这样的语音合成人的技术,我们从2006年开始进行全球的竞赛,暴风雪竞赛,一直连续12年我们都拿了全球第一,2016年的时候英语合成能力已经超过了普通人。如果播音员的说话是5分,普通人说话是4分,机器说话的程度到了什么样?说中文的时候是4.5分,说英文是4.2分,就意味着机器说的比人还要好。

第二个技术就是语音识别技术,听的能力。我相信在座有很多人都用我们的讯飞输入法,已经有5亿用户了,准确率是98%。从2008年开始就参加了说话人识别的大赛里面获得了全球第一,2016年也获得了全球第一。第三个是机器翻译技术,2014年之前,英翻汉是美国人第一,汉翻英是中国人第一,我们参加了比赛之后,两个都是中国人第一了。另外能听会说,能说会看的就是感知智能上的进展,更重要的是认知智能上的突破了。我们的常识推理技术在2016年拿了第一的成绩,但是也是获得了仅仅58分这样的成绩,可以说在认知智能领域无论是我们还是全球都需要有很多新的突破点。还有知识发现技术,以及图象识别的技术都在近期的比赛当中拿了第一。所以在这样的核心技术上要牢牢掌握住源头,并且做到最好。

实际上我们机器说了一段话,他不仅可以说中文还可以说英文,更重要的是可以合成每个人的声纹特点。如果你到录音棚,或者我们提取两个小时符合质量的录音的话,就可以合成你任何想说的话了。我们再看看语音识别,这是今年3月份在两会期间,我们做了一个网上的直播,由讯飞听见这样一个转写系统对李克强总理的两会报告进行了现场的直播转写,当时我们也看到了转写的成功率是100%,我们现在基本上可以实现95%以上的转写成功率。

这是我们2015年12月21号的年度发布会上就发布了,去年的发布会上我们不但可以重复转写中文到中文,还可以翻译成英文、日文、维吾尔语等等语言,这也是帮助大家从简单重复的劳动当中解放出来,从事更多有价值的工作。所以我们看到未来这个产业的一些发展的情况,我们也认为随着第6次IT浪潮的到来,越来越多的机器离你有一定的距离,你需要和他交互的时候,也不需要键盘,你需要触摸的时候,我们认为3—5年这样一个人机交互的时代,就是以键盘触摸为辅,以语音为主的时代就会到来,那么人和机器的互动就会像人和人之间的互动一样,语音就是非常自然的交互方式。而且我们认为未来人工智能将像水和电一样无处不在,也会进入到每个行业,深刻改变我们的生产和生活。
 

\

分享了这些在技术上的成果,其实更重要的我们将要做的事情,就是在应用领域,AI+应用是非常重要的方向,我们要把这个技术把产业界和生活相结合。应用是硬道理。

接下来看看科大迅飞战略布局。

 \

2011年我们就把语音平台开放给公众了,大家可以在平台上进行更多的研发和创新,我们也选择了一些非常重要的行业赛道,比如说教育、医疗、智慧城市,C端消费者的一些产品等等,这样子的一些围绕我们整个核心技术来进行的布局。所以我们会形成一个平台加赛道的这样一个模式。

 \

我们也认为,现在第一次人工智能浪潮,怎么样才能复兴呢?我们现在是否具备比较成熟的条件或者是环境呢?我们认为人工智能如果想获得大的发展,应该是具备三个要素,第一个就是核心技术,核心技术一定是源头创新的力量。第二个就是行业大数据,随着我们向互联网和移动互联网的发展,中国积累了非常多的好的大数据,这样的大数据为我们的算法提供了更多的可能。第三个因素就是行业的专家,代表了我们人类最优秀的能力,让机器通过行业专家对我们行业大数据进行定标,然后机器学习这样一些能力,通过核心的算法,形成了我们非常多的行业应用的发展。我们根据现在的分析和判断,我们认为现在真的可能进入到人工智能发展的一个新的阶段了,我们会将他用在教育、社会城市管理、医疗、家居生活,交通甚至金融、环保等等,各种各样的数据都可以用算法在应用上获得新的体现。

 \

具体可以看一下,一个是在个人领域,还有一个是在行业领域,首先看看C端的产品上,讯飞输入法,已经实现了98%的准确率,而且5亿用户,越来越多的人愿意用我们的产品,他可以识别21种方言,尤其是可以实现中文和英文,还有其他语言的一些互译。还有叫灵犀的语音助手,除了翻译还可以帮你实现很多生活中方便的功能。还有一款是突然爆红的产品,就是翻译机,其实在灵犀语音助手上已经有这样的软件了,但是大家更喜欢这样的硬件体验,翻译的水平目前是在大学6级,日常对话应该没有什么问题。很快,我们在9月份就要推出全球首款的离线翻译,可以帮助大家走到哪里都能实现很好的交互功能。

 \

个人领域越来越多的C端产品,还有我们的音响,我们的魔盒,可以和我们的家电进行更多的互动。我们再看看在行业应用领域的拓展吧。

比如说教育是我们非常重要的战略赛道,科大迅飞一直想做中国智慧教育的第一品牌。我们在教学考评馆的各个环节做服务。无论是政府做的教育的顶层设计,还是数字校园,还是数字课堂,以及一些互联网产品,都可以看得到非常多的人工智能的手段参与其中,比如说我们可以把学生的大数据,后台做分析,给你推送不同的题目,根据你知识点的薄弱,节约你的时间。再比如说人工智能的一些技术使得全学科阅卷成为可能。甚至可以改作文。使得人减轻了很多的负担。教育部考试中心也和我们的人工智能成立了实验室,有1万多所学校用我们的产品,在我们的教育体系上,越来越多的人希望能够把英才施教真正变为现实。

再看看成是管理上,在大数据进行后台的跑腿,老百姓只要到一个柜台上只跑一次就把很多事情解决了,这也是后台打通非常多部门和进行一些大数据运算的能力。

 \

再看看医疗,医疗是下一步人工智能的重点突破的一个方向,不仅仅是我们的智能语音,大家想象你去看牙医或者在做B超检查的时候,医生两个手都在忙碌,旁边跟着一个助手替他记录诊断的结果,现在只要带上我们的耳机,就可以说左上牙,蛀牙等等,非常专业的术语,在后台自动形成病例,和后台是打通的,让他的录入非常的简单高效。

 \

我们在医疗影像识别的方向也获得了很多的进步。比如说在影像识别这一块,8月份我们刷新了世界记录是92.3%的准确率,最新的数据是94.1%的准确率,我们刷新了自己创造的世界记录,获得了第一的技术。我们会让无论是乳腺癌还是肺结核等等诊断更准确。同时搭建了诊断的平台,让机器在平台上对很多的片子进行判断,实际上已经具备比很多医生还要强的能力。今年在医疗方向上的突破,包括和中国医学科学院、北京协和医院签署了很多的合作,以及建了一个中国人工智能的医院,想打造一些新的医疗模式。

 \

我们再看看智能客服的领域,大家有没有体验过有些客户电话在跟你交流的时候,实际上是机器人在跟你对话,比如说海底捞有30%的服务是用机器跟你对话。未来金融、运营商、政府、医疗等等行业,智能客服的技术我们也做了非常多的突破和创始,特别像人形机器人晓曼,如果在医院他就是导诊的机器人。如果在银行他就是大堂经理,给你推荐理财套餐等等。实现人力的解放。

 \

再看看公检法领域,一方面是机器可以替代书记员进行转写和笔录。第二点是机器学习了大量的法律法规和卷宗,可以帮助你进行量刑的建议,这块在公检法系统会用的越来越多。

再看看汽车领域,我们在汽车的智能语音的市场中我们的占有率是90%,当你把车窗摇下来,早噪声全开的情况下真正能实现人车交流的技术只有科大迅飞才能做到,所以越来越多的厂商采用了我们的人车交互的技术,其实在车里你不仅可以问我要去哪儿,吃什么东西,还可以说我要打开天窗,或者座椅后摇,等等这些都可以实现,未来汽车就可以成为我们非常重要的工作和娱乐的场所了。

我们看到了我们应用的发展,人工智能的产业生态我们认为是大家一起去共生、共享和共融的。我们平台上的数据10年开放以来增长是越来越快,每天在平台上日均交互的次数已经到了40亿人次了,累积覆盖终端数是14.7亿次,凝聚的创意团队有40万个,越来越多的创新氛围都可以围绕在这个创新的引擎上,是一种赋能的技术。

\

我们整个AI在技术上获得一定突破的时候,我们也很希望在整个应用上获得真正的一些落地,特别像我们需要去营造一个很好的产业孵化的氛围,北上广深这样的一线城市应该特别有一种对科技开放和包容的态度,比如说机器首次的翻译亮相是在广州的3月28号国际投资年会上,我们在大会上用了转写,说中文,出中文,同时翻译成英文的技术,这是非常好的技术,可以应用到很多的场景。同时我们也希望更多的数据拿出来,人工智能是大数据喂养大的,我们需要加大喂养的规模,包括人才,不仅仅引进,更多需要行业去培养和孵化的,也希望可以竖起行业标杆,加大投入力度。

所以在AI领域,我们认为我们是一个登山型的公司,当你们看到我们的时候,我们已经在这条路上走了18年了,但是我们还只是站在半山腰上,我们还有非常多的事要做,有很多研发任务,很多应用领域要探索,而且我觉得在中国、上海,北京、广州这样非常好的城市,无论是珠江还是黄浦江都要汇入大海,在这样非常好的地域有无限上升的空间供你想象,在这里每个人都可以找到你生活和生产,还有工作的想象的上限,可以让你把AI+应用和更多的产业、机会、梦想结合,才会产生越来越多有价值,有意义的事情,人工智能也会离我们越来越近。

谢谢大家!

来源:TRACKER创新
赞一下
文章评论
推荐文章