人加:帮助机器人睁开双眼看世界 | 创业
动点科技 · 2018-01-10 10:16:01 · 热度:加载中...

人加:帮助机器人睁开双眼看世界 | 创业

初创公司报道智能硬件机器人 2018/01/10

让机器看懂世界,这应该是无数人工智能行业从业者的梦想,然而,工欲善其事必先利其器,在让机器看懂世界之前,我们更应该首先为它打造一双能够看懂世界的眼睛。

人类采用双眼看世界,双眼不仅使我们能够看见物体形状颜色,其视差效应更让我们得以判断物体的远近,而判断距离的能力也是人工智能最为急需的能力之一。因此,双目摄像头便成了当前为机器赋予视觉能力最为重要的方案之一。

而 2016 年 3 月拿到索道资本天使轮融资后成立的 人加科技 便是这么一家旨在利用双目摄像头为机器赋予视觉能力的科技企业之一,不过,该公司最核心的技术并不只是双目摄像头,而是双目摄像头背后的双目视觉计算模组。

卡位智能视觉产业入口

人加科技创始人李嘉俊是一个连续创业者,在创立人加科技之前,其曾参入创立了一家 VR 硬件公司,不过后来因为个人原因,决定换个赛道创业。至于为什么选择双目摄像头进行创业,则是因为认准了机器人时代必将到来,而选择卡位双目摄像头这个智能视觉产业的关键断点和入口:

当时,李嘉俊和团队看见国外有款叫 “大黄蜂”(Bumblebee)的双目摄像头产品,它主要运用在工业领域,接口很老,跟现在的 PC 无法连接,应用性极差,所以很多机器人视觉算法研究者使用这款产品的时候都觉得很痛苦,抱怨很多。

“我们看到这是个机会,同时也因为当时太想创业了,于是就决定做双目摄像机,做一款便宜、好用、跟得上时代步伐(至少得用 USB3.0 接口)的双目摄像头,虽然我们当时也意识到了双目摄像头对人工智能的重要性,但我们以为双目摄像头可能需要 5 到 10 年才能火起来,所以我们当时做得不急不躁,希望脚踏实地,一步一步攻克核心技术,耐心打磨精品,从来没想到风口来得能这么快。”李嘉俊如此介绍。

所以当风口来了之后,人加科技凭借其领先的技术得到了更多人的认可,从而迎来了较快的发展时期,其不仅于 2017 年 1 月完成了千万级别人民币的 PreA 轮融资,员工人数也增加到了 20 余人,更重要的,人加科技已经累计发布了数款司眸系列双目视觉感知计算模组:

该系列模组最高分辨率为 480P,3 米处的测量精度可达厘米级,最远测量距离 15 米。而该系列中体积最小的 MS240 分辨率虽然只有 240P,但其重量仅 7g,功耗最低仅 0.8W,而且其还拥有高达 100fps 的实时感知速率,满足高速运动场景需求。

另外,李嘉俊还表示,目前他们的技术其实已经达到了 1280*800 的分辨率,最大测量距离为 50 米,10 米以内的精度可达厘米级,克服了复杂的室外光线影响。

而在标定上,人加科技也实现了机器人自动标定,用以取代传统视觉方案中的人工标定,不仅解放了人力,更提高了效率和稳定性。

MS240

FPGA 加速视觉算法是人加最大竞争优势

据了解,人加的双目视觉感知计算模组采用了 FPGA 方案,这是一种解决大数据计算问题比较流行的方法。李嘉俊介绍,包括阿里巴巴的云服务,微软的数据中心,百度深度学习研究院等都采用了 FPGA 方案。

“一个算法模型要在电脑上实现是比较容易的,但要在 FPGA 上实现便意味着整个算法都需要进行重新设计,重新架构,我们能够将一个大规模的计算通过一个相对便宜的 FPGA 来实现,这便是我们公司的核心能力。”也正是因为 FPGA 开发难度比较大,因此,“凡是有 FPGA 开发能力的公司,在市场中都比较抢手。”李嘉俊如此表示。

据了解,人加科技能够快速增长,源于团队在 FPGA 加速领域 10 多年科研与工程实践的积累,因此拥有了这个领域最稀缺因此也是最珍贵的研发人才和研发能力。

“据悉这个领域某个公司,他们的创始人甚至已经在 FPGA 领域出书了,但是其公司近两年来却依然没有发布任何一款成熟的产品。”因此,李嘉俊认为自己相对于市面上很多公司都有着 1 到 2 年的竞争优势。“任何一家企业想要做到我们现在的水准,都需要 1 年到 2 年的时间,所以我们在这个争分夺秒的赛道上我们还是领先的。”

能做 FPGA 开发的团队不少,但市场也足够大

“FPGA 的开发虽然有难度,但并不是说这件事只有我们能干,而别人干不了,我相信行业里会有很多人也有 FPGA 的开发能力,但在行业内有很多不同领域的问题都需要 FPGA 来解决,比如云端加速等,而我们只是用 FPGA 做深度感知,而这只是整个市场中的一小部分。”李嘉俊的这个回答其实也部分回答了“AI 时代下,市场能够容下多少家芯片企业”的问题。

据了解,人加的视觉模组在某种意义上也可以称之为芯片,而众所周知的是,在 CPU、GPU 等芯片领域,目前我们所能看见的企业并不多。而在人工智能背景下,我们却发现包括地平线、寒武纪等非常多的公司都在推出自己的芯片产品,AI 行业能够挤下这么多芯片企业?

对此,李嘉俊认为这得将芯片分为“大芯片”和“小芯片”分别来讲,“大芯片是指基础性的、比较关键的芯片,其未来格局就会跟现在的 CPU、GPU 的格局差不多,一个行业内只能有一两家独大的公司。”而对于那些跟各个细分场景紧密结合、专门用来解决这些垂直场景问题的“小芯片”,“他们的机会将是非常多的,因为 AI 的应用场景很广,不同应用场景下的计算需求也不一样,这里面便会有非常广阔的市场空间。在“大芯片”与“小芯片”的格局形成之前,FPGA 是非常合适的解决方案。”显然,李嘉俊非常看好自己所属的 FPGA 加速人工智能计算这个领域的发展和前景。

双目立体视觉方案市场即将爆发

据了解,双目立体视觉一直被认为是解决机器人导航等诸多问题的最佳方案之一,市场炒了几年但我们至今也没有看到双目立体视觉产品的大规模出货。李嘉俊也谈到“目前还没大批起量”,但他强调现在已经到“爆发的前期”,” 有些走在前沿的机器人公司已经认可我们并陆续与我们签订订单,这对整个行业来说也是一个可喜的走势。” 李嘉俊如此表示。

“以前大部分人对双目摄像头的认知都是它虽然很好,但它还没有成熟,技术也没有稳定,价格更是还没有降下来。但实际上,一些行业先锋在体验或者使用之后会告诉你另一个答案:我们的方案已经很好了。”李嘉俊认为 iPhoneX 的发布将促使双目方案的爆发,“iPhoneX 发布之后,越来越多的人将专注到 3D 视觉,他们将思考苹果为什么要用 3D 方案而不是传统的 2D 方案做人脸识别?越来越多的人将会思考 3D 视觉的好处,而这将是 3D 视觉真正得以爆发的关键时机。”

“目前双目视觉产品虽已签订部分订单但是还没大批出量,因此我们的目标便是要捅破这层窗户纸,而我们是最距离窗户纸最近也就是最适合捅破这层窗户纸的人。”李嘉俊预计到 18 年年底,人加双目方案的订单将达到 10 万台左右。

本文来源:动点科技