AI语音下半场,思必驰的“芯”棋局 | 星特写
联想之星 · 2021-03-26 17:39:49 · 热度:加载中...

与过往互联网、移动互联网浪潮的兴衰成败截然不同,AI领域的下半场仍是紧贴技术标尺的发展逻辑,没有显现出竞争长跑终结和行业地位固化的趋势,而是拉开了一个高度离散的竞争序幕,比拼各家对行业和场景颗粒度的理解深度。

对于智能语音赛道,竞合局势则更为复杂。智能语音是人工智能技术的制高点,在技术关联和数据层次上天生具有更高的复杂度,单单自然语言理解和处理的能力提升,就耗费了科学家们数十年的心血,才有今日之产品交互体验。

随着AI技术的商业化落地,现在标榜智能化的产品,语音交互或多或少都成了一项必备技能,在黑白家电、音箱、手机、穿戴设备、汽车乃至墙壁开关等贴近生活的产品中随处可见。

市场繁荣的另一面,紧迫感也愈发突出:

首先,狼多肉少、竞争加剧,从互联网科技巨头,到智能语音技术公司虽然梯队明显,但如何形成终端体验差异化却十分困难;

其次,技术布局被迫纵深,从软件平台生态到硬件芯片方案,不得不加大投入强化技术链路,融资虽高却往往入不敷出;

第三,落地场景过于细碎,即便是技术水平相同的企业,对不同垂直行业和细分场景的取舍也会导向截然不同的成败结局。

智能语音商业浪潮背后的竞逐者诸多,那么留给这些独角兽的成长空间还有多大?主要玩家接下来还要拼什么?透过智能语音赛道独角兽思必驰的布局,我们能看到一些答案。

认真对待“造芯”这件事

为了让智能终端拥有更好的语音交互体验,针对语音算法打造相匹配的AI芯片模组,采用软硬一体化的解决方案几乎是目前行业最为普遍的选择,也是技术迭代的必然路径。

这个做法谈不上多有新意,但优劣的差别在于,语音技术公司造芯是否足够专业。

很多人可能没有关注到,2020年12月,上海深聪半导体有限责任公司获得了数千万元Pre-A轮融资,而深聪智能便是思必驰联合中芯国际旗下的产业投资基金中芯聚源共同注资成立的芯片设计企业。

思必驰借力合作补齐了半导体基因,进展神速。2018年3月搭建团队,8月份便成功流片,11月芯片完成点亮验证。到了2019年1月,思必驰的第一代AI芯片产品TAIHANG (TH1520)正式发布亮相,4月份量产光罩流片,7月份量产版芯片也成功点亮,前后不过一年左右时间。

语音技术公司跨界成立芯片公司,还能独立获得融资发展,这在该赛道中着实少见,而芯片业务也有望成为思必驰后期发展的一大助力。

众所周知,研发语音AI芯片的一大难点其实是算法公司、芯片公司对于市场客户的理解方式不一样,话语权通常不对等,但在思必驰旗下的芯片团队中能看到两种基因的深度契合,这让造芯之事变得更加靠谱,也少走了很多弯路,更能从底层设计入手让芯片具备广泛的适用能力。

AI芯片普遍讲究高性能、低功耗,差之毫厘,体验就失之千里。

据了解,思必驰的TH1520芯片采用了AI指令集扩展和算法硬件加速的方式,使其相较于传统通用芯片具有10倍以上的性能提升。此外,在芯片架构上具有算力及存储资源的灵活性,支持未来算法的升级和扩展。

而在功耗表现方面低至毫瓦级,典型工作场景功耗仅需几十毫瓦,极端场景峰值功耗不超过百毫瓦,同时支持多种主流麦克风阵列和接口,足以在各类IoT产品中灵活部署应用。据了解,该芯片下一代已于2020年年底顺利流片,并预计于2021年下半年进行量产。

对于顶尖的算法公司来说,涉足造芯能够补齐全链路战略的最后一块技术版图,但做芯片并不能靠一时的热情和噱头推动,而是考验之后的战略定力和长期投入准备,做精做细,这是包括思必驰在内的独角兽们所需要PK的最硬核的技术维度。

解决方案需要更多创新绝技

对于智能语音技术公司来讲,如今的关键在于,这些方案究竟能实现怎样的成本控制和独特的交互体验,能否满足实际业务升级需求。

以思必驰的TH1520-TV方案为例,该方案曾首批落地于海信S7F社交电视产品中,TH1520芯片配合思必驰线性四麦阵列前端信号处理算法,以及思必驰的语音识别(ASR)、语音合成(TTS)等技术,能让电视交互体验实现大幅升级。

据了解,TH1520作为AI语音交互专用协处理器, 可通过USB与电视机主板相连,只需要占用电视主SOC极低的带宽和算力就能实现AI语音交互能力,能够有效解决电视在多场景频繁切换、轮播、4K电影播放尤其是网络加载阶段CPU占用高导致的系统卡顿问题。

其中有一个功能叫“待机唤醒”,顾名思义,即电视在待机模式下,通过语音命令就能直接打开电视,完全不需要遥控器去操作,大大方便了用户。待机唤醒模式功耗也特别低,安静状态下仅为数十毫瓦,嘈杂状态下功耗也在百毫瓦以内。

除了智能电视,思必驰基于TH1520打造的双模式混合交互方案,能让各种其他智能家居家电产品具备灵敏的语音交互体验和联动效果,模组可以嵌入到空调、冰箱、洗衣机、智能厨卫、客卧小家电以及车载设备等产品中。

很多创新技能独树一帜,例如融合离在线的交互模式,系统能智能决策离在线的处理方式,设备有没有联网都能实现语音交互。据了解,离线模式下可以支持200条本地命令词和自定义,以及音色切换、噪声优化、识别带口音的唤醒词等,在线模式下,依托思必驰的DUI平台,技能还可不断扩充,设备控制、影音视听、信息搜索、儿童读物等内容可自由选择对接。

还有“全双工交互技术”,能让语音交互实现类真人的体验,支持连续交互、动态断句、语义打断、噪声拒识等功能。全双工交互技术涉及到全链路语音交互的各个模块,不仅需要对前端信号处理、AEC回声消除有较高要求,对噪声处理以及对识别后的语义信息等进行综合判断及处理后才能做出决策,思必驰之外,支持全双工功能的语音芯片模组在业内并不多见。

当我们身边的语音交互设备太多,经常一个命令会同时误唤醒了多个设备怎么办?思必驰基于TH1520实现的“就近唤醒”功能就很好解决了这个问题,该方案并非简单的取决于与用户距离的远近,而是依据哪台设备所接收到的正面声能更多来决定响应与否。

据了解,针对品牌白电厂商、小家电方案商、运营商、行业客户、海外厂商、中小型开发者的不同需求,思必驰已推出多种方案选择,包括SDK、算法系统方案、芯片方案、模组方案、整机方案、Amazon AVS定制版、运营商定制版、行业场景定制版等。

独具特色的技术解决方案能让产品的终端体验与众不同,形成产品竞争的差异化,这也是思必驰的市场杀手锏。

新一轮跑马圈地已开始

思必驰基于TH1520发展的“云+芯”一体化整体解决方案,在一些垂直行业的渗透正在加速,已成为了许多行业大客户所青睐的技术供应商。

例如在车载领域,思必驰就已与北汽、一汽、上汽、五菱、东风、小鹏汽车等企业在智能座舱语音交互方面展开了合作,已推出包括长城哈弗系列、荣威RX5MAX、小鹏P7/G3、宝骏E系、新宝骏R系、北汽BEIJING-X7、东风皮卡等多款热门车型。

在白电领域,思必驰与美的共同成立了“美的-思必驰AI联合研究实验室”,美的旗下多款智能家电都采用了思必驰的解决方案,双方合作共同开拓智能家居技术生态,在思必驰获得的Pre-IPO轮战略融资中,也有美的资本的身影。

在电视大屏或影音娱乐产品中,思必驰的技术方案也有很多样板落地,例如米家投影仪2、小米电视大师、峰米4K激光影院Max、长虹极智屏A8U PRO/D7P PRO、海信社交电视S7F、康佳APHAEA A5艺术全景声智慧电视等。

无论是单品智能还是全宅智能,单一交互还是多模态交互,智能语音技术的应用在趋势上都正在成为一项热门技能,业内对于语音交互的未来畅想是非常美好的,即有一天,人们可以与身边的一切智能机器说话交流。

因此,近年来车载、物联网、智能家居、智能穿戴、黑白家电、服务机器人等领域都是所有智能语音公司的必争之地,而接下来的考验是,谁能从中瓜分到更多的利润场景和最优质的客户。

站在现在的发展节点上,各家智能语音独角兽除了比拼技术的创新迭代能力,还应加速对市场客户的攻占,提升盈利能力之外。利好的一面是,智能语音技术的渗透和用户接受程度目前都还处于早期增量阶段,市场尚未变成红海,规模体量也是一个仁者见仁的问题,因为并没有明显的市场边界区分,关键在于每个企业自己能把握住多少,每个垂直行业看上去都足够大,只要能占据可观的市场份额。

经过几年市场的锤炼,国内的智能语音赛道到了“竞逐者们”真正拼硬实力的时刻,谁能把技术壁垒加高加强,把创新方案做好,把客户服务好,给社会创造价值,谁才是执牛耳者。

相关阅读

为虚拟偶像,真情实感地氪金 | 星特写

小马智行开年铆劲狂奔 | 星特写

创业时代,“她”有力量 | 星特写

磁悬浮创造新奇迹 | 星特写

本文来源:联想之星