Vizum董霄剑:给机器一双眼,2米内视觉误差小于1毫米

 •  原文链接

         

萧伯纳曾说过,你看见一样东西就会问“为什么”,而我会梦想那些还未出现的东西,并且问“为什么不?”。


当为所有机器人装上一双眼睛的梦想呈现在董霄剑面前时,他问自己:为什么不呢?



作者|安妮的盒子

编辑|小鱼、甲小姐

网址|www.xtecher.com

微信公众号ID|Xtecher


眼睛是心灵的窗户,是人类获取外部信息最重要的感觉器官。而董霄剑要做的事,是给机器人都装上一双智慧的眼睛,让它们看懂这个世界。


于是他做出一个重要的决定——进军人工智能领域,专攻立体智能视觉。


6401.jpg

原展讯通信首席科学家、伟景智能( Vizum)CEO董霄剑


2016年6月3日,董霄剑放弃令许多人羡慕的高薪、高管职位,全身心地投入到这项事业中去,创办了专注研究和发展机器视觉的北京伟景智能科技有限公司(以下简称Vizum)。


走进董霄剑的办公室,一本《图像处理、分析与机器视觉》和其它的一些技术资料躺在他的办公桌上。


“这里面没有我想要的答案。”董霄剑告诉Xtecher记者。


这是一个全新的挑战,答案的确无处可寻,只有做出真正的创新才能获得打开这扇“心灵之窗”的钥匙。创业后的董霄剑已经做好绝不回头的打算。


轻松的事情,都不叫创新


这位在展讯历史上不多的、上上下下都称之为“董博”的首席科学家总是喜欢看“大势”,并且头脑极其活跃,是个极致的思考者。


很多人都是通过“AlphaGo”知道的人工智能,但董霄剑却并非“随大溜”。事实上,早在2011年,时任展讯通信首席科学家的董霄剑在考虑展讯技术发展计划时就大胆提出:要大力发展人工智能!而当时,他主要看好的就是人脸识别的巨大市场前景。


这在当时绝对算得上是一件非常超前的事了,那时很多人甚至要特别去搜索一下人工智能为何物;还有的人则认为,在中国发展人工智能是想都不敢想的事情。


董霄剑却很坚定,他相信这是高科技公司早晚要去涉足的领域,且随着各种算法性能和芯片处理能力的提升,人工智能一定会大放异彩。除此之外,他还开始思考人工智能最应该解决什么样的问题。


他观察到,现在行业内做视觉识别的,多半是从一个角度形成机器对物体的平面识别,可人类看到的事物一定是立体的,单从这一点来看,平面就注定无法让物体拥有类人水平的视觉识别能力。


除此之外,如何在“看”世界后,让机器真正“看懂”世界,这就要求视觉识别在基于感知层、认知层的层面上拥有进一步的“思考能力”,包括信息处理以及机器自我语言处理。想要让未来的机器人理解和传递信息,必须从“教会”机器人“看懂”这个世界开始。


一个始终萦绕在董霄剑脑海中的问题,什么样的眼睛才能帮助机器人真正看清、看懂这个世界?


“首先它要是‘一双’才行,人类进化几千年形成现在的器官形态,是一件很美妙的事情,也是大自然最为合理的构造,所以机器人的眼睛也应该是双目/多目的。”董霄剑说,“并且它还应该是立体的、彩色的,且一定是高精度、可量化的。我们的智能视觉不仅是表面简单的图像分类,而是能智能地解决实际的应用问题。 ”


显然董霄剑要做的是核心的统一化的立体智能视觉技术和产品,是突破性的理论和产品创新。这样的要求对技术和理论的挑战非常大,传统的应用于机器人的视觉技术可以简单的概括为“有认知无立体,有立体无认知”。


长期从事通信芯片系统和算法研究使他有着深厚的信号处理理论功底。他所具有的跨学科综合理论技术——雷达信号处理+通信信号处理+图像信号处理+芯片系统研究——使得Vizum能够把各个领域的理论技术移花接木的应用到视觉计算领域从而巧妙破解了这些技术障碍和难题并展现出可持续提高的技术路线。


“事实上,在未来的‘智能+物联网+5G通信+芯片’的大潮中正好是我们大展身手的好机会。未来,我们会推出基于5G网络的具有智能感知和认知的物联网芯片,而机器的增强感知就从我们的智能眼开始。”


董霄剑所带领的团队不仅在智能图像处理领域拥有深厚的理论基础,而且在立体视觉、物体识别、深度学习的融合应用上也拥有深厚的技术积累,加上他本人快速研发和实现产品化的能力,Vizum很快得到业界和资本的关注。


2017年5月22日,Vizum完成来自产业领军方的5000万元人民币A轮融资,这是Vizum继2016年底完成来自恒坤睿金、将门创投的数千万级天使轮投资后,在半年的时间里完成的第二次融资。


从六年前认定人工智能领域的发展方向,到如今自己挂帅创立Vizum,一切看上去都顺理成章而又厚积薄发。而对于自己要做的事,他已经做好迎难克坚的准备:“这的确不是一个轻松的挑战,伟大公司的成功是需要用难题做铺路石的。”


别站在人群中,要站在跑道上


硕士毕业的第一年,董霄剑就已经成为百万富翁。


那是1992年,最火的科技产品当属腰间的寻呼机。和其他琢磨着如何攒下在当时不菲的一笔钱来买一台寻呼机的同龄人不同,雷达信号处理专业出身的董霄剑已自己动手做起寻呼机系统。


当时寻呼机的编码卡都是国外设计和生产,技术被卡着脖子,价格当然由别人定,成本百来块的东西,国外产品的售价可以卖到3万5千块。


那一年,董霄剑就成为国际一线厂商在寻呼这块业务上的最大劲敌。他敏锐感觉到这个市场机会,并用了五个月的时间,自己亲手焊板子、写代码,硬是把寻呼机编码卡给做出来了,售价只有5000块,价格是进口产品的零头。由他创办的寻呼公司所开发的编码卡和寻呼软件在华东地区的市场占有率一度高达30%。


Picture2.png

上世纪90年代初,寻呼机是最炫酷的科技产品


一个好玩的段子至今让董霄剑记忆犹新。”他喜欢打篮球,当时很少人有手机,总是凑不齐人一起打球,于是他干脆给几个朋友各送了一台寻呼机,从此再也不愁打球凑不齐人了!”


四年后,拿到人生第一桶金的董霄剑面对许多机会和选择,但他最终决定去东南大学攻读无线电工程博士学位。总是着眼于大势的他又一次预见了时代的发展方向——移动通讯。


面对躁动的一切,能够放弃漫天飞的钞票而选择重返校园深造,这在许多人看来实在不可思议。他描述,20年前,“大哥大”还是奢侈品,“下海”经商的人极其活跃,我国的东南部率先富了起来,人们蠢蠢欲动,都希望抓住一夜暴富的机会。


“我始终觉得想要实现一个目标,必须全力以赴、心无旁贷。别站在人群中,要站在跑道上!在专业领域和最牛的人一起做事情。”


博士毕业后,董霄剑凭借其深厚的技术积累、独到的市场洞察力和对创新的不懈追求,在2006年受邀加入了展讯通讯,担任全新的WD部门负责人,目标瞄准CMMB、WCDMA和WIMAX产品。


期间,他和他的团队曾用2个月时间研发出适应广电数字电视广播标准的CMMB系统设计方案,是“从拿到标准到系统设计完成”业界最快的经典案例之一。这款产品不仅各方面都满足行业高标准,也是市场上第一颗CMMB的SOC芯片,到CMMB芯片量产只用了10个月。


2009年,为了提高某款初期TD芯片在中移的外场测试中的通信性能,董霄剑带领30个左右的上海工程师到北京,封闭式开发,从穿T-shirt的季节到穿棉袄的季节,最终实现了使用此芯片的手机系列的入网和成功入库。凭借在TD-SCDMA和CMMB项目开发上展现的技术实力和研发组织能力,董霄剑被任命为展讯通信首席科学家,获得了展讯最高技术级别,也成为整个公司那时唯一一个达到这一技术级别的人。


也正是从2009年起,董霄剑开始负责展讯全新一代的TD-SCDMA\EDGE\GSM多模40nm芯片的系统算法设计,这款芯片将展讯多模芯片产品的性能提升到一个新的高度,其通话稳定性和数据吞吐量都是行业第一,成为展讯历史上的经典。而后,董霄剑又带领的一个15人的算法团队从标准开始进行LTE产品的系统设计,最终完成LTE的MODEM算法,软硬件架构和射频需求等设计。


640.jpg

在展讯时的“董博”


从业近20年,让董霄剑成为移动通讯时代当之无愧的风云人物,也让他愈加深刻地感受到:将一个研究的理论变成真正的产品,其付出、努力和艰辛要远远大于单纯的技术“点”的突破,这要求实践者不仅拥有深厚的理论知识,而且还需要他们熟悉产品的研发过程。


这一次,他又站在了为所有机器人和移动设备装上一双类人的“眼睛”的赛道上,决意一搏。


最美好的愿望,一定最疯狂


人类文明的发展已经到了人工智能时代,这是一个不以人的意志为转移的时代。


在这样一个产品化的时代,董霄剑认为,一个公司和一个研究机构在实现一个伟大的产品上应有着天然的不同——最明显的是公司可以针对市场需求,系统地组织一项技术以及一个产品、吸收社会各种资源来做一件事情,而研究机构只需要一个技术点就可以了,在这点上,纯研究机构不太可能成为伟大产品的创造者。


可身边的人却时常可以在如今的董霄剑身上看到一个在研究机构里搞研究的人的身影——他钻研成像的原理,和自己的团队讨论计算机视觉技术,甚至探索起光的本质……


很多人认为,给所有机器人和移动设备装上一双类人的“眼睛”,让他们能认知、理解外部世界,并最终实现真正的智能,这听上去更像是一个不可能完成的愿望,美好又疯狂。


“就是要做别人想都不敢想的事。”董霄剑笑着说。


纵观他的职业生涯,历经三次大转型,最让人称扬的是每次对时代发展脉络的准确把握,从雷达到寻呼,从寻呼到手机,从手机到人工智能,每一次新技术趋势的到来,董霄剑都是这个领域积极活跃的前锋。


能抓住机遇,发挥创新者的潜质、资质、能力,成为这个领域的弄潮儿,这让他感到兴奋。


如今,Vizum团队核心成员皆来自国内外知名半导体公司,在手机基带芯片、物联网、智能硬件等领域有大量成功开发案例,参与量产的芯片总计近20款,涉及通信及多媒体,累计总销量达数亿片……


有了前沿的创新理论、丰富的工程经验,加上团队高效的执行力以及快速实现产品迭代的能力,成立半年的Vizum就在去年年底推出可市场化、应用性高的机器智能眼产品——ViEye。


ViEye可以完成3D数据获取和物体识别,主要聚焦于与机器人配合的工业应用场景。它给机器人和设备提供的不是一种简单的数据罗列和视觉图像,而是一个在其自我认知基础上“看到”的立体而丰富的世界,并能根据特定需求自主呈现高精度3D坐标及高精细度目标尺寸等量化信息,目前的产品2米内视觉误差为1毫米。随着认知能力和芯片集成度的不断提高,ViEye的功能将不断增强,机器人也会有越来越明亮和智慧的“眼睛”。


正如Vizum的预期,产业界对ViEye的反响极其强烈,“实际上,这是‘机器换人’强大趋势的一个侧面反映和必然的现实”董霄剑说。


Picture1.png

ViEye产品原型图


而在董霄剑心中,Vizum的产品还要挑战更多。他告诉Xtecher,今年,ViEye产品应用功能将扩展至3D场景重建、3D人脸识别和智能认知,满足移动避障、环境认知等应用的需求。


为了这个既疯狂又美好的愿望,他现在每天坚持快走,每周都会抽空去游泳。“我们正在追求的目标很远大也极富挑战。”董霄剑坚信Vizum将会成为一个伟大的机器智能公司,为此他必须保持精力充沛。“我的投资人对我只有一个要求,就是坚持运动。”