普强信息何国涛:在语音分析和车载语音市场,我们要比科大讯飞跑得更快

 •  原文链接

           

在成为语音数据分析市场的NO.1之后,何国涛的下一个战场,是800亿的车载语音市场。他不甘心等待行业大佬们的分割,他想拼尽全力跨越金字塔的塔尖。把这套系统作为入口,将更多的数据收入囊中。再通过大数据分析,彻底改变整个汽车服务生态及周边行业。


车载语音市场,将要迎来一位挑战者。普强信息已进入语音数据分析和车载语音并行的时代。


作者|崔艳

采访、编辑|小鱼

网址|www.xtecher.com

微信公众号ID|Xtecher


“继续做,干嘛要停?”

 

接触计算机30年,做语音20年的何国涛,并不想停止他在语音分析领域的脚步。他在2009年创立的普强信息科技有限公司现在已经坐稳中国市场语音大数据分析行业第一的宝座,接下来,他瞄准的是车载语音的战场。

 

数据显示,语音交互的市场规模预计将超过200亿美元。国内外IT巨头,包括车厂都在想尽办法涉足这个领域,抢夺语音交互的赛道。亚马逊开放Echo音箱的语音识别技术;Facebook创始人扎克伯格去年自己花100小时完成AI管家Jarvis的开发;而在国内, 除了BAT们在抓紧时间谋篇布局,思必驰、云知声、声智科技、Rokid等创业公司也在发力这个领域。

 

2015年,普强切入车载场景,联手四维图新和腾讯,共同开发出“云+端+芯片”的智能车联网大数据系统。

 

何国涛知道,这一战,他要跑得比科大讯飞更快。


不断膨胀的梦想

 

何国涛思索了一下,说:“我发现,我开始欠他们一个梦想”。

 

这个名为“普强信息”的梦想包含了太多人的期待。2009年创立普强信息的时候,何国涛只想当好一个程序员,和喜欢的人一起做有价值的事情,花两年时间写程序,然后卖掉。

 

“谁知道,两年过后,程序写完了,为了证明程序有用,需要自己回国找客户。找了之后发现确实卖不掉,又要重新在上面加一层再加一层,加人、加钱,又要去找投资人。到最后,终于有了客户。”

 

但是程序员何国涛不知不觉间已经转身成为普强信息CEO何国涛。

 

他要完成投资人和员工们的梦想。把普强信息做成语音数据分析市场的第一,做出世界最好的人机交互系统,让员工能在北京买得起房子……

 

这个不断膨胀的梦想起源于何国涛9岁时。当时的他和澳门其他孩子没有什么区别,爱做大他3岁的哥哥后面的跟屁虫。唯一不一样的地方,可能就是兄弟俩早早就表现出对数学异乎寻常的天赋。

 

因为家庭经济拮据,兄弟俩想用其他方法赚零花钱。当时澳门对于童工的各项规范尚未健全,哥哥就带着弟弟出去打暑期工。整个暑假都在制衣厂里剪线头,把赚到的钱偷偷存起来。攒了两年,一数,竟然有3000多元。

 

这笔巨款最后变成了一台苹果电脑。兄弟俩就在这部电脑上玩游戏,玩腻了就考虑能不能把游戏修改一下,于是哥哥又带着何国涛,靠着一本书自学编程。

 

在兴趣作为源动力的时间里,兄弟俩靠着这台电脑,写编程参赛。1989年,何国涛被保送到华侨大学,选择了计算机专业。“也没有什么高大上的理由,只是觉得计算机容易找工作”。

 

大学的前两年,何国涛迷失了方向。在学生会、办酒会、做兼职,他知道这样的状态不能延续,但是又不知道该往哪走。

 

这时,在北京大学物理系读研的哥哥问他:“北大还不错,要不要过来试一下?”

 

本科毕业,何国涛考上了北京大学的网络研究室。在北大,何国涛开始深入接触计算机网络,跟着导师为广东建设银行写一个基于TCP-IP的银行网络中间件,对方非常满意,以一套100万的价格购买,产品非常成功,后来还卖给了多家银行。

 

何国涛所在的网络实验室, 就是著名的北大“天网”项目成立的地方,北大天网是国内第一个基于网页索引搜索的搜索引擎。在这个被誉为国内中文搜索领域一面旗帜的天网项目中,培养出一批国内早期的互联网搜索领域人才。何国涛的师兄,刘建国、雷鸣、周利民,后来跟随当时名不见经传的李彦宏,成为了“百度七剑客”。

 

何国涛没有留下,他再次选择跟随哥哥的步伐,来到美国雪城大学(Syracuse University)。3年后,身处硅谷的哥哥再次问他:“硅谷这边还不错,要不要过来试一下?”

 

何国涛点了点头。


语音数据分析市场的NO.1


在硅谷,何国涛做了很多次尝试。他曾在HP、Aruba networks等公司从事Opencall、Voice XML、无线网关等产品的研究和开发,HP多媒体服务器的语音识别技术,就是他所在的小组研发的。他对创业公司情有独钟,精兵、高效、灵活,非常符合何国涛的追求。

 

“决定创业的时候,我本想着做两年,把产品做好了就够了”。没想到,光是语音识别引擎,何国涛的团队就写了5年。

 

这对何国涛来说,是异常艰辛的5年。整个普强信息团队整天写算法,方向从一开始的图像识别转移到语音识别,他们唯一的产出就是代码,但是这些代码能不能变成真金白银,还是一个未知数。

 

语音识别是底层技术,可以与口语教育、安防、监听,甚至机器人完美结合。何国涛也探索过移动APP,做过订票系统和在线教育的产品,但是始终达不到标准。

 

“如果你做一两年完成的产品,别人花一两年也能做出来,产品就没有太大的价值。所以他一直要求我们要做到很深很深,做出一件别人需要花十年才能做出的东西。”

 

何国涛口中的“他”就是黄炎松。这位硅谷华人圈里最成功的创投家,成为何国涛创业道路上的引路人,同时,也是普强信息的天使投资人。

 

当时的黄炎松已经60多岁,成功带领4家公司在美国上市,他没有像其他投资者一样急于求成,反而提高了对普强信息技术实力的要求。

 

有了产品,何国涛把公司从美国加州硅谷转移到国内运营。找客户,何国涛找到了当年在北大的师弟雷鸣,此时的雷鸣已经离开百度,自创门户建立了酷我音乐。而另一位师弟刘建国,身份也从百度的CTO转换成了生活搜索网站爱帮网的CEO。

 

后来,酷我音乐和爱帮网,开始嵌入普强智能的语音搜索引擎。慢慢地,何国涛发现,和这些移动互联网APP的合作,很难找到赢利点。这让他陷入焦虑。

 

此时,普强信息遇到第一个大客户,联想。负责的是呼叫中心的数据分析和语音识别。这次合作,让何国涛见识到了大公司对语音识别的巨大需求以及背后雄厚的利润回报。

 

何国涛开始分析科大讯飞的财报,他发现,作为语音技术领域当仁不让的老大,科大讯飞在语音数据分析上每年能获得3000万的收入,而在系统集成、安防、教育领域的盈利以亿的规模计算。作为盈利能力最强的云数据分析,却没有被放在最受重视的位置。何国涛发现了其中隐藏着的机会。他决定,“打他的弱项”。

 

于是何国涛决定专注于语音数据分析领域。

 

2010年,普强科技推出了“千语语音识别引擎系统”和“千语千寻语音分析系统”。

 

这款引擎的开发应用了深度神经网络技术,通过语音切分技术和对识别结果的算法,进行语速探测、情绪识别等,以及对讲话对象、时间边界等进行分割,不仅提高了语音识别结果,也可以辅助企业进一步挖掘和分析海量语音数据。

 

千语千寻语音分析系统面向呼叫中心,在客服与顾客通话过程中,将不同方言的来电转换成文字,还能根据不同的系统用户需求,标注出关键用词,并针对其进行统计和专业化分析,挖掘客户需求。


“快”和“准”,是语音分析市场颠扑不破的标准。千语千寻语音分析系统的全文识别率可达85%以上,关键词识别率达95%以上。中文语音分析速度国内最快,它拥有的文本分析引擎和索引处理技术,能够实现分析操作在秒级以内完成,而业内多数语音公司的产品则要半小时甚至更久。

 

“当时我就跟客户说,我们现在的分析系统就分析这块,15秒出结果,而其他竞争对手需要2个小时。”目前普强在业界公开招投标的项目中,中标率能达到70%。“我们拿什么打败科大讯飞那种积淀和实力雄厚的大企业,只有产品、服务和口碑。”

 

随着2014年底与保险电销的龙头企业招商信诺开始深入合作,经过三年的发展, 普强已经和数十家大型保险、银行和互联网金融公司进行合作,占据了金融行业语音分析市场的80%份额。

 

2017年FINTECH金融科技的概念,也无意间验证了何国涛当年的判断。

 

随着语音数据分析市场的领先地位确立,何国涛又开始思考起人机对话主要刚需场景:车载语音。


看准800亿的车载语音市场

 

800亿的车载市场,就是何国涛对准的阿喀琉斯之踵。

 

2015年,何国涛带领着普强信息切入车载场景,联手四维图新和腾讯,共同开发出“云+端+芯片”的智能车联网大数据系统WeDrive。

 

四维图新是国内领先的综合地理信息服务提供商,其数字地图一直主导中国前装车载导航市场,合作品牌几乎囊括国内各大主流车厂。近年来,在四维图新CEO程鹏的领导下,采取创新+战略投资的“双轮驱动”策略,由传统地图转向车联网和自动驾驶。正是何国涛对四维这一战略的强烈认同,最终接受了四维的投资。

 

在这次联姻中,四维负责导航,腾讯负责内容,普强提供语音交互技术。相对于群雄逐鹿的后装市场,市场份额更稳定、价值收入更高的前装市场更具吸引力。全球老大Nuance占了较大的份额,国内龙头科大讯飞也跃跃欲试。但在另一方面,出品周期长和对接流程复杂也挡住了吃螃蟹者的脚步。


何国涛的智能车载语音系统,是由“云+端+芯片”组成的。普强自主研发的云+端语音交互系统能有效的避免车内网络不通对语音识别的影响。另外方案中的阵列麦克风可抑制噪音回音,进行声源定位。车载降噪DSP芯片可进行车载降噪去回声。

 

此外,为了极致的用户体验,普强会针对不同车辆本身的胎躁、风噪、发动机噪等噪音特性,量身定制属于该款车辆的声学模型算法,提高行驶过程中的语音识别率。

 

何国涛想要的不仅是这块市场,更是想把这套系统作为入口,将更多的数据收入囊中。

 

百度首席科学家吴恩达曾说过,“语音识别从95%的准确度到99%的准确度带来的不是量变而是质变,是从你偶尔使用语音变到常常使用。做到99%准确,将彻底改变人与设备的交互。”

 

当时,吴恩达正在百度负责“百度大脑”项目,而作为基础的就是百度的语音技术。BAT也有意涉足语音分析领域,他们最大的优势在于海量的数据。

 

没有人会比何国涛更了解数据的价值。但是如何以道德的方式收集数据,更好地运用数据为用户服务,何国涛想了很多种方法。比如车险。

 

“中国的车险市场是大概6000亿,现在的车险大多采用平均主义,与你的驾驶时间和习惯无关。我可以把车机系统免费送给驾驶习惯良好的司机,在这一年内,通过系统记录到的数据证实没有违规行为,年底用户买车险就可以减免一大块费用。

 

对于用户来说,这是看得见摸得着的好处。激励司机追求更好的驾驶行为,对于社会的交通状况有益。对于普强信息来说,这一年积累下来的驾驶数据,能够让他们看得更深更远。

 

另一方面,何国涛还想过,针对暴雨等恶劣天气,推出短时间的保险。“你从家里到公司是五公里,半个小时就到了,你害怕这段路车子会被暴雨冲走,就可以通过车机系统买一个半小时的保险,系统实时监控,结束之后自动计算金额,可能两毛钱,你只需要在车里面点了一下说:“好,同意。”

 

把这些数据通过符合法律和道德的方式挖掘出来,通过数据分析和模拟,可能会在不远的未来彻底改变整个汽车服务生态及周边行业。


越过塔尖的勇气

 

“大客户将从目前70左右扩展到100个,在车载系统方面,树立至少两个标杆客户。”

 

这是何国涛给普强信息定下的年底目标。离线的语音识别和语义理解,是普强信息的优势所在。做云端的云识别引擎,在世界市场上有谷歌、微软、亚马逊和苹果这些巨头,国内有科大讯飞和云知声,中文的在线语音识别引擎加起来超过50家。但能实现中文车载嵌入式引擎加起来不超过5家。

 

“如果再努力一下,我们就是第一。”

 

“我们要先把中文的车载系统做到国内最好, 然后是全世界最好!”

 

何国涛坦诚地表达他对普强信息未来的期望,但横亘在他面前的,是人才和技术的难关。“语音分析市场其实并不热,只是最近才比较热”。市场热闹起来,人才也就更加难求。

 

“所以我现在最大任务就是稳住这帮兄弟”,普强信息的核心团队很稳定,创立时的第一个员工现在还在团队内,何国涛认为这是最值得自豪的事情之一。

 

其次,要加快技术和客户端匹配的速度。每次合作一个客户,团队都要花1~3个月时间对接,随着市场的苏醒,普强信息的客户群体越来越大,但为了保证用户满意度,让他们不敢接单。

 

为解决以上问题,普强将在今年下半年引进最新的神经网络技术,用神经网络去自动建模,这样将会加快用户产品的适配速度,从而加速市场布局,也为明年年底实现千个客户的市场规模做好准备。

 

万事俱备,何国涛耐心地等待着东风的到来。他把创业形容为彩排,“需要一个节点一个节点地去完成,如果直接跳到结局就没意思了”。

 

下一个节点,将会在三到四年之后。何国涛透露,明年年中将会进行下一轮融资,下一步,就是上市。

 

“每一步都要有阶段性成果,唯一的验证就是在这个领域做到最好”。何国涛在心里计算着普强信息与行业金字塔塔尖的距离,完成超越的油门,就在他的脚下。