车音网沈康麒和他的智能驾车服务

<article><section data-type="rtext">车音网出售的是一种智能副驾服务。通过内置于车内的蓝牙终端，驾驶员只要开口说话就会连接到语音云平台，可以拨打电话、点播音乐、收听新闻、查询天气和路况信息、寻求紧急救援，还可以与其他车主语音微博互动或开个电话会议。诸如此类的语音数据交互车音网每天能处理30万次以上。2011年6月，车音网获得了江苏高科和美国所罗门1亿元人民币的第二轮融资。<img src="//himg2.huanqiucdn.cn/attachment2010/2013/0602/20130602032537362.jpg?imageView2/2/w/750" data-alt="图：车音网创始人沈康麟(摄：梁斌)"/>2011年5月，一汽奔腾成为了车音网前装市场的第一个客户。目前，奔腾B70、莲花L3、斯巴鲁全车系、一汽丰田卡罗拉等车型也在使用车音网的服务。但在创业早期，沈康麒瞄准的应用场景是呼叫中心，希望帮助电信运营商节省大量人工成本，但运营商对此却提不起兴趣。直到2006年底，沈康麒再次去语音交互服务公司 Tellme考察，他发现，Tellme的主要收入来自为通用Onstar做外包服务。沈康麒迅速调整了研发方向，专攻车载语音识别。车音网所在的行业叫车载信息服务，即特马(Telematics)。包括通用Onstar、丰田G-Book、欧洲ATK、福特Wingcast都是提供此类服务。在创办车音网前，沈康麒曾在 InfoTalk公司担任中国区经理，负责中文语音识别项目，为银行、电信、机场等提供语音识别技术支持。目前，车音网主要提供以下四方面服务：语音识别声闻识别语音检索自然语法下的语音识别车音网提供的语音识别服务不需要用户进行学习过程，所以后台系统必须积累大量的语料，包括收集不同年龄、地域、性别的用户在不同行车环境下的语料。车音网副总裁陆凌涛透露：训练服务器听懂不同的人说话，提高语音识别率，要采集大量的语料数据，还要在不同网络环境中做测试，这需要很长时间的积累。第一款产品从研发、测试到推出经历了近两年时间。沈康麒带领一支20多人的团队，负责为车音网收集语料。公司为这支团队配备了10辆车，他们的工作任务是在全国各地出差，寻找不同类型的发音人。根据识别引擎不同方面的训练和测试要求，发音人的选取要进行年龄、性别、口音区等平衡设计。发音人需要在不同噪音的行车环境中，致电车音网的后台处理系统，花一个多小时读完一份车音网设计的两三页文稿。在沈康麒看来，更高的语音识别率能够帮助车音网在未来形成竞争门槛。海量数据的语料分析，是公司最核心的竞争资源，也是研发成本重心。“提升语音识别率不是不计成本就可以做到的，考验的是投入时间。”沈康麒称公司目前的语音识别率可以达到95%。声纹识别可以实现对特定用户的识别，目前车音网已经开始使用这一技术。对于未来的语音识别服务，自然语法下的语音识别将是竞争的关键，所有搜索引擎公司和大数据公司都在语义理解技术上寻求突破。沈康麒表示，不出现颠覆性算法情况下，凭借自然语音识别，我们至少能领先竞争对手三年时间。在 第五届云计算大会上，沈康麒将就车音网在智能驾车服务领域的体会与大家分享。(综合/ 包研 审校/仲浩)</section></article>

车音网出售的是一种智能副驾服务。通过内置于车内的蓝牙终端，驾驶员只要开口说话就会连接到语音云平台，可以拨打电话、点播音乐、收听新闻、查询天气和路况信息、寻求紧急救援，还可以与其他车主语音微博互动或开个电话会议。诸如此类的语音数据交互车音网每天能处理30万次以上。2011年6月，车音网获得了江苏高科和美国所罗门1亿元人民币的第二轮融资。

2011年5月，一汽奔腾成为了车音网前装市场的第一个客户。目前，奔腾B70、莲花L3、斯巴鲁全车系、一汽丰田卡罗拉等车型也在使用车音网的服务。

但在创业早期，沈康麒瞄准的应用场景是呼叫中心，希望帮助电信运营商节省大量人工成本，但运营商对此却提不起兴趣。直到2006年底，沈康麒再次去语音交互服务公司 Tellme考察，他发现，Tellme的主要收入来自为通用Onstar做外包服务。沈康麒迅速调整了研发方向，专攻车载语音识别。

车音网所在的行业叫车载信息服务，即特马(Telematics)。包括通用Onstar、丰田G-Book、欧洲ATK、福特Wingcast都是提供此类服务。

在创办车音网前，沈康麒曾在 InfoTalk公司担任中国区经理，负责中文语音识别项目，为银行、电信、机场等提供语音识别技术支持。

目前，车音网主要提供以下四方面服务：

语音识别

声闻识别

语音检索

自然语法下的语音识别

车音网提供的语音识别服务不需要用户进行学习过程，所以后台系统必须积累大量的语料，包括收集不同年龄、地域、性别的用户在不同行车环境下的语料。车音网副总裁陆凌涛透露：训练服务器听懂不同的人说话，提高语音识别率，要采集大量的语料数据，还要在不同网络环境中做测试，这需要很长时间的积累。第一款产品从研发、测试到推出经历了近两年时间。

沈康麒带领一支20多人的团队，负责为车音网收集语料。公司为这支团队配备了10辆车，他们的工作任务是在全国各地出差，寻找不同类型的发音人。根据识别引擎不同方面的训练和测试要求，发音人的选取要进行年龄、性别、口音区等平衡设计。发音人需要在不同噪音的行车环境中，致电车音网的后台处理系统，花一个多小时读完一份车音网设计的两三页文稿。

在沈康麒看来，更高的语音识别率能够帮助车音网在未来形成竞争门槛。海量数据的语料分析，是公司最核心的竞争资源，也是研发成本重心。“提升语音识别率不是不计成本就可以做到的，考验的是投入时间。”沈康麒称公司目前的语音识别率可以达到95%。

声纹识别可以实现对特定用户的识别，目前车音网已经开始使用这一技术。

对于未来的语音识别服务，自然语法下的语音识别将是竞争的关键，所有搜索引擎公司和大数据公司都在语义理解技术上寻求突破。沈康麒表示，不出现颠覆性算法情况下，凭借自然语音识别，我们至少能领先竞争对手三年时间。

在第五届云计算大会上，沈康麒将就车音网在智能驾车服务领域的体会与大家分享。(综合/ 包研审校/仲浩)