旷视印奇:“降低门槛”和“场景创新”是旷视AIoT产业合作的两大关键词
36氪 · 2023-03-21 08:00:00 · 热度:加载中...
“我们的目标是要做影响物理世界的AI技术创新。”

  作者|韦世玮

  人工智能场景的应用与落地门槛正进一步降低。

  在近日举办的2023旷视企业业务合作伙伴大会上,旷视展示了最新一年的产品规划与技术布局全景图,还包括公司在空间数字化落地方面的最新实践。“旷视的目标是要做影响物理世界的AI技术创新。”旷视联合创始人、CEO印奇在会上强调。

  从2011年成立至今,旷视已经走过了12个年头。回溯这十余年发展,旷视从一家以人脸识别算法起家的企业,逐步扩大AI技术的探索边界和应用场景,成为如今在国内AIoT领域TOP级的人工智能企业。

  如果要用一个关键词来简单总结如今旷视企业业务发展的特点,那就是“接地气”,这背后是AI产品易用性、生态合作门槛的大大降低,同时所覆盖的场景和解决方案也更聚焦当下AI落地实际的痛点及需求,让AI技术不再是以往高高在上的黑科技。

  正如印奇所强调的那样,仅有好的AI技术是远远不够的,还必须将其变成最好的产品,并与合作伙伴一起为客户创造价值。毫无疑问,创造更加丰富和有价值的场景应用,并接受市场真正的检验,才是一家AI企业得以在未来可持续发展的动力。

  01、旷视AIoT的三位一体布局与两大关键词

  旷视联合创始人、CEO印奇提到,旷视通用的人工智能体系分为感知、决策、执行、反馈四大模块。“它像一个人,有眼睛、耳朵,有各种传感器能感知外部世界,大脑做决策控制身体做执行。”他说。

  在印奇看来,未来十年人工智能会有两大发展方向,一个是AI in Digital(数字世界),以ChatGPT技术为代表;一个是AI in Physical(物理世界),以特斯拉这类企业为代表。

  面向AI in Digital,近期旷视花了大量时间研究大模型的发展,印奇认为,在这场知识逻辑引擎变革中,未来人们需要做好迎接新的技术范式的准备。面向AI in Physical,其本质是将AI引擎与更多硬件相结合,即AIoT大方向,这是旷视坚定选择的发展路径。

  为此,旷视构建了三位一体布局,涵盖基础科研(通用视觉大模型/细分领域大模型)、AI核心技术基础设施(AI生产力平台Brain++,开放深度学习框架MegEngine,算法生产平台AIS)、智能机器(边缘计算盒子/面板机/AI IPC/机器人/自动驾驶)。

  旷视联合创始人、CEO印奇

  回顾旷视12年的发展历程,技术信仰和价值务实两个核心文化贯穿始终。在这个过程里,旷视逐步构建了强大的技术体系,一支包含500名科学家的科研队伍,能够全方位对新AI技术演进进行引领和探索。“旷视会把自身最核心的技术能力长期保持领先,同时与合作伙伴一起,在真正重要的行业领域深耕开发。”印奇提到。

  如今,旷视已形成AI基础设施类产品和智能机器人AIoT产品两大产品体系。印奇认为,沿着AIoT路径发展,不光要聚焦技术科研,还要聚焦在如何将科研技术变成好的产品。今年,旷视会将算法量产能力批量给合作伙伴,进一步推动AI的平民化,让更多人具备开发算法的能力。随着数字感知逐步延伸到更多类机器人的场景,旷视也将以硬件为载体,推出更多从边缘计算到面板机的产品。

  在印奇看来,AI行业如今已慢慢形成一定的头部效应,尤其是在后疫情时代,有两大趋势会非常明显:一是头部领域整合加剧,能够持续提供可靠产品和服务的AI头部公司会越来越集中;二是碎片领域分工精细化,将会有更多垂直领域精细化的AI产品出现。

  未来两到三年,旷视牵引整个生态及合作伙伴有两大关键词,一是“降低门槛”,提高AIoT产品的易用性,降低开发门槛,让每一个合作伙伴你能够自由地创造,在各个行业挖掘真正刚性的需求;二是“场景创新”,与合作伙伴进一步深入行业、了解客户,为客户提供更多与其应用场景和期待相匹配的创新产品。

  02、旷视企业业务的三大核心关键力

  在过去一年时间里,旷视与全国各地的合作伙伴共创了80多个场景方案。例如在江西打造的机场行李回框方案,在四川落地的学校“明厨亮灶”方案,在广东探索的电力系统智慧化创新等。“我们要做的事情就是把旷视很多技术切实地变为软硬一体的产品,再跟合作伙伴的方案整合在一起,最终帮助我们的客户创造价值。”旷视企业业务事业部负责人赵康说。

  在赵康看来,场景一定与某个特定空间相关联,而那些在特定空间里发生的每个场景,它们都具有共性特征。因此,旷视企业业务的思路是:不断地抓住场景共性,并融合为场景解决方案,从而打破行业边界,促进AIoT的规模化落地。

  谈及旷视企业业务在空间数字化业务方面的落地,赵康将其总结为三个核心关键力:产品力、生态力、场景力,产品力和生态力共同支撑着场景力。

  其中,场景力是旷视与合作伙伴共同实现客户海量场景应用价值的能力;产品力不仅需要产品本身技术过硬,还要具备可交付性、易用性以及高对接能力;生态力则是企业从采购起就将责任纳入重点考核因素,对合作伙伴支撑到位。

  纵向来看,旷视企业业务提供了三个主态产品:最底层为模组产品,主要面对的是一些有制造和研发能力的产品方案商;中间层是AI技术软硬一体化产品,如面板机;顶层是场景产品方案,如运动侧的“运动猿”、中心侧的“盘古”等。

  横向来看,这三个主态产品与不同的上层应用相结合,实现不同的产品平台,从而给客户创造价值,而这些上层行业应用亦依赖于各个合作伙伴的支撑。

  旷视企业业务事业部负责人赵康

  03、一款好的AI产品需具备的三大特质

  在2022年,旷视针对AIoT海量的应用场景需求,提出了“算法定义硬件”的产品理念。简单来说,算法是产品的核心要素,硬件将围绕算力的优化和算法支撑来重新设计,逐步走向标准化。同时,标准化硬件能够通过加载不同算法,灵活演变成不同的智能化硬件,从而满足海量场景的应用需求。

  如今,旷视围绕“算法定义硬件”提出了另一个新思路——“简单使用AI”,这也是最能体现今年旷视企业业务规划产品和发布新品的思路。

  旷视联合创始人、企业业务事业部产研负责人杨沐谈到,未来三年,人工智能产品的市场规模将会出现强劲增长的势头。在产品规划上,面临大量的市场需求,如何进行简单交付将是一个问题。

  对此,旷视将产品简单交付分为三个方向:高效选品、高效交付、高效口碑。“我们认为,一个真正好的AI产品必须是能够简单被使用。”杨沐解释,这体现在选品简单、交付简单,最后客户现场使用时依然能收获好口碑。

  在这一产品规划思路指导下,旷视希望今年起所有产品设计都能让客户“闭着眼睛选”,这首先要让产品同时具备高性能、高性价比和少品类属性,解决客户的“选择困难症”。在产品矩阵方面,为确保产品竞争力,今年旷视的产品焕新率将超过60%,并将发布更多针对不同渠道、不同产品定位的系列,以覆盖更多渠道区间和更多解决客户需求的定位。在发布更多新品和更多SKU的同时,旷视依然会保持少品类、高扩展性的设计思路。

  谈及今年的产品规划亮点和思路,杨沐提到,现阶段旷视企业业务产品体系可分为身份识别类产品、感知分析类产品、创新产品方案三大系列。身份识别类产品是旷视布局最久的产品线,今年旷视将在开发灵活性上推出Linux和安卓SDK,让合作伙伴能更方便地开发自定义通行面板机并接入平台,同时还会针对掌纹识别推出新产品。

  在感知分析类产品方面,旷视将推出魔方B4X行业系列、HCB一体机系列,以及行业相机系列,同时将进一步优化交付体验,在使用口碑上保持算法精度和种类的领先性不掉队,保持业界领先的供应水平。

  在创新类产品方面,旷视在2022年下半年已正式发布运动猿体育空间数字化系列,今年团队将进一步打磨该产品,与合作伙伴一起探索更具创新的方案。

  旷视联合创始人、企业业务事业部产研负责人杨沐

  在分享完旷视企业业务的最新技术、产品布局和落地实践之后,36氪等媒体与旷视联合创始人、企业业务事业部产研负责人、AI产品官杨沐,以及旷视企业业务事业部市场负责人乔梁展开了一场深度对话。

  这场对话从旷视本身出发,更进一步了解了旷视在AIoT市场的布局与打法;从行业角度出发,也让我们看到了旷视是如何直面快速变化与挑战重重的人工智能行业,摸索出一条更具差异化竞争力的发展路径。

  以下为36氪等媒体与旷视科技专访的对话,经精选和编辑:

  Q:去年旷视提出了空间数字化的概念,今年是否会有一些新技术或是理念的升级?

  杨沐:叫升级可以,叫自然延伸也可以。今年我们提“简单”这个词,算法定义硬件,更多表达我们的核心竞争力和我们能够提供的创造性价值,我们最清楚算法,我们知道怎么围绕一个个算法场景去设计硬件、去设计整套体系化,使单品的性价比、性能更优。

  但我们今年更往前延伸一点,我们需要把这个优势落地到每一个场景。我们还是朝着原先定的路线不断地往前进,不断完善我们这一套以AI、以感知分析、以生物识别为核心的产品体系。

  Q:旷视今年有60%产品要焕新,这个迭代节奏是怎么考虑的?从客户的角度看,如果兼顾效率、成本等因素来考虑,旷视驱动客户焕新的动力有哪些?

  杨沐:最大的动力肯定还是性能和性价比,以及定位上的区别。以面板机为例,我们拥有3寸、5寸、7寸全系列,原先只有最高端的焕新,现在我们会推出标准款、渠道款,每个等级对应到管理策略有些区别,这使得我们推出的产品更匹配市场上的现有需求,当推出一个更适合客户的产品时,客户可能更倾向于使用这款产品。

  乔梁:这其中可能有两个层面的焕新,一个是硬件产品的焕新,另一个是客户需求对于算法的焕新。

  硬件层面的焕新主要针对合作伙伴,我们经过这一年的空间数字化,发现每一类客户对硬件的需求都可能存在差异,今年我们的产品会更贴近每一类具体的用户,让他们能得到更高性价比、更贴近需求的产品。在算法层面的焕新,我们这块的做法不是让客户更换已采购的我们的产品,而是我们采用算法定义硬件的方式,让客户硬件里面的算法可以不断地焕新。

  Q:会上有提到,旷视的魔方系列产品与市场同类的产品比,在同等价格下可以提供4倍的领先性,这个领先性具体体现在哪?

  乔梁:这个4倍其实是指总体产品为客户带来价值提升总体效能的4倍,并非技术参数。在同等价位或者同等算力的芯片上,我们会比同类产品有更强的算法表现。比如摄像头的输入画面,其他产品只能解析一路,但我们能解析四路。同时,我们会利用各种策略——比如用误报盾来降低误报,能够帮助客户大幅提升产品的使用效率,无需担心误报对工作造成的影响。此外就是客户需求的焕新,如果客户想要更换或升级算法,我们也提供这样的能力,所以是整体产品效能的提升。

  Q:您如何看待今年人工智能的发展?在疫情环境逐渐改善后,旷视如何将AI技术或能力更好地产品化?

  杨沐:分两个维度,外部可能有非常多变化,比如疫情对大家的心态有积极、消极的不同影响,同时比如像ChatGPT,国外有一些爆款出现,又影响了大家对行业的态度,这个是国际竞争维度和行业发展维度驱使的。但有内生的发展规律在不断推动这个行业,哪怕是疫情严重的时候,其实我们的AI产品不管是销售量,还是收集到的需求也在呈现爆发。

  去年到了临界点的时候,我们分析过单路智能化的成本已经跟我们新建一套视频系统的单路成本持平了,这对以后来说做智能化或者做AI不是一种很奢侈的东西。我认为当临界点破的时候,它就是一个非常标准化的,公司既需要做视频感知、视频存储,也要做智能化分析、智能化转化,这个行业就是芯片和硬件不断地发展,成本不断地靠近产业化规模的需求,最终这个市场一定会出反馈,现在供需平衡了,我要把客户需求提升、落地,这个才是这个市场在增长的内因。

  Q:ChatGPT大语言模型应用跟旷视做视觉识别有哪些可以借鉴或者共通的地方吗?

  杨沐:首先技术肯定是共通的,比如ChatGPT是把所有图像信息和语言信息都统一对应到特征表示上。比如我们用ChatGPT技术输入一段文字,我要在视频里面找一个戴红帽子的人,你就输入视频里面有没有红帽子的人,它就能找到视频里红帽子的人。

  事实上在深度学习领域,不管是文字、图像,其实在大模型里都有可能映射到这个方向上,触类旁通。当然视频图像密集型的训练会跟语言领域有很大差异,它的成熟度还没有像ChatGPT到了那个时间点。未来或许会有通用性的模型出现,那个时候也会有更具创造力的产品创新,未来是值得畅想的。

  Q:未来旷视如何在保持领先性的同时做出更大的差异化?

  杨沐:大部分的AI场景还没到同质化竞争的阶段,市场上确实有非常多不同的方案在提供,但我们还是回归到场景本身,如果一个场景只是为了合规性需求买一个设备摆在那里,却从来不开机,这种场景其实不需要竞争,我们可能更多关注真的有实际使用和转化的场景。

  在转化场景里,像通行类产品成熟度相对高,其他的产品品类还远远没有到同质化竞争比拼价格的阶段。通行场景同样如此,我认为通行场景并没有被业界广泛解决,例如面板机离真正消费品的标杆还有很大距离。

  除了性价比以外还有很多方向,比如说合规保护等措施,这些都是大家需要关注的。首先我们把该做的事情做好,性价比要符合这个市场的逻辑,在这个基础上我们持续地用高标准、高质量的要求,这样我们的产品就能够脱颖而出。

本文来源:36氪