车音网出售的是一种智能副驾服务。通过内置于车内的蓝牙终端,驾驶员只要开口说话就会连接到语音云平台,可以拨打电话、点播音乐、收听新闻、查询天气和路况信息、寻求紧急救援,还可以与其他车主语音微博互动或开个电话会议。诸如此类的语音数据交互车音网每天能处理30万次以上。2011年6月,车音网获得了江苏高科和美国所罗门1亿元人民币的第二轮融资。

2011年5月,一汽奔腾成为了车音网前装市场的第一个客户。目前,奔腾B70、莲花L3、斯巴鲁全车系、一汽丰田卡罗拉等车型也在使用车音网的服务。
但在创业早期,沈康麒瞄准的应用场景是呼叫中心,希望帮助电信运营商节省大量人工成本,但运营商对此却提不起兴趣。直到2006年底,沈康麒再次去语音交互服务公司 Tellme考察,他发现,Tellme的主要收入来自为通用Onstar做外包服务。沈康麒迅速调整了研发方向,专攻车载语音识别。
车音网所在的行业叫车载信息服务,即特马(Telematics)。包括通用Onstar、丰田G-Book、欧洲ATK、福特Wingcast都是提供此类服务。
在创办车音网前,沈康麒曾在 InfoTalk公司担任中国区经理,负责中文语音识别项目,为银行、电信、机场等提供语音识别技术支持。
目前,车音网主要提供以下四方面服务:
语音识别
声闻识别
语音检索
自然语法下的语音识别
车音网提供的语音识别服务不需要用户进行学习过程,所以后台系统必须积累大量的语料,包括收集不同年龄、地域、性别的用户在不同行车环境下的语料。车音网副总裁陆凌涛透露:训练服务器听懂不同的人说话,提高语音识别率,要采集大量的语料数据,还要在不同网络环境中做测试,这需要很长时间的积累。第一款产品从研发、测试到推出经历了近两年时间。
沈康麒带领一支20多人的团队,负责为车音网收集语料。公司为这支团队配备了10辆车,他们的工作任务是在全国各地出差,寻找不同类型的发音人。根据识别引擎不同方面的训练和测试要求,发音人的选取要进行年龄、性别、口音区等平衡设计。发音人需要在不同噪音的行车环境中,致电车音网的后台处理系统,花一个多小时读完一份车音网设计的两三页文稿。
在沈康麒看来,更高的语音识别率能够帮助车音网在未来形成竞争门槛。海量数据的语料分析,是公司最核心的竞争资源,也是研发成本重心。“提升语音识别率不是不计成本就可以做到的,考验的是投入时间。”沈康麒称公司目前的语音识别率可以达到95%。
声纹识别可以实现对特定用户的识别,目前车音网已经开始使用这一技术。
对于未来的语音识别服务,自然语法下的语音识别将是竞争的关键,所有搜索引擎公司和大数据公司都在语义理解技术上寻求突破。沈康麒表示,不出现颠覆性算法情况下,凭借自然语音识别,我们至少能领先竞争对手三年时间。
在 第五届云计算大会上,沈康麒将就车音网在智能驾车服务领域的体会与大家分享。(综合/ 包研 审校/仲浩)