科大讯飞有个语音云。以前真不知道。
3月22日下午,在鸟巢旁边的国家会议中心,搞了一个一千多人的发布会。开始了中国语音云服务开放平台新业务的启航,开发者热情很高,对讯飞老总大屏幕的语音云的演示,爆发出阵阵掌声。
我也受邀去参加了这个发布会,确实很震撼,给了我很多意料之外的讯息。
没参加发布会之前,不熟悉讯飞。零星听过科大讯飞,一直以为是一家研究机构,是高校自办的研究型企业,大概不会有多大市场化的运作。做的和中科院声学所等机构差不多的事情。
没想到讯飞早在2001年就接受过柳传志旗下联想投资的投资,且已经上市。成为公众公司,早已走出高校。
邀请我去参加开发者大会,我是想看看传说中的中国siri概念企业,是如何玩转语音的。我对siri的未来都没看好,自然不太看好中国的siri。没想到发布会后,有了一些改变。
这让我想起八十年代初,中国大地上大家对四化的憧憬。
当年邓小平访日回来,报纸上到处流露对日本高科技的敬仰,但结果是,中国的科技一直没发展起来,日本的高科技模式也没能惠及中国。倒是美国逐步发展起了信息产业,特别是互联网的发展,让全世界为之彻底改变。而中国富裕的劳动力资源,让中国在随后的二十年,主动放弃了高科技,成为全球制造业基地。最近十年,最大的创新企业,皆来自美国,除了全球化市场给了美国创新企业更大发展空间外,创新制度也是美国高科技持续发展的保证。反观中国,小企业创新太容易被巨头扼杀,所以拥有核心技术的小公司,往往令人担心市场前景。
八十年代初,小灵通漫游的故事,谈到的是2000年的高科技远景,结果基本没实现;四个现代化说到上世纪末实现,结果也没实现。语音输入和语音输出特别是语义智能控制,也是布局近三十年的技术。虽然有了互联网新机制和新模式的介入,有了快速发展,但我个人还是不乐观。对语音技术的推广和大规模应用,必将再等十年后。siri随着iPad的普及,得到大规模启动,但要真正结合移动设备,普及到未来每个电子设备,解放双手,也一定是五年甚至十后的事情。
同样,作为语音国家队的讯飞,其在语音技术领域的积累,是有大前途的基础方向,但最近五年必然很辛苦。
找到互联网和云的概念,但平台融合是大难题,而对开发者的引导则是关键中的关键。
从现在看来,语音和导航,地图,标准生活服务,是可以快速起步的方向。特别是解放双手,比如汽车导航,语音答录,音频社交等,是可立即开始的方向。
那天的语音云开发者大会,请到了李开复到场。李上世纪八十年代做研究生时,就是语音识别方向。他也表示最近几年语音技术发展迅速,但也不是那么乐观。语音识别容易,语义理解难。如何突破语义智能不高的问题?还涉及到一个用户体验和期望值的问题:人们一旦用语音,期望值很高,很难满足,但有了云,正反馈系统,语音提高很快,语义依然有问题。
因此,语音要想更快发展,首先要问,应用在哪里?似乎那个会议提出了一个基本方向:开发者推动,平台和云。即语音输入和合成输出技术到语音云概念的变化。目前,讯飞的语音合成技术有了大的提升,在国际已经领先,这是一个好方向。比如为残障人士服务,驾车等应用中嵌入,语音api的开放,进入娱乐社交等,虽然还是有一定的难度。
会议完后,对语音技术国家队的科大讯飞,有了新的认识。如果真正做大开放平台,有上万家开发企业,这个产业的前景,大概会提前五年。起码乐观起来了。
语音云和四个现代化
评论
16 views