眼神科技周军:十年一顾再谈多模态

产品详细介绍:

  2019世界创新者年会(World Innovators Meet 2019, 简称WIM2019),于2019年12月6日在北京·国贸大酒店拉开序幕。本届大会由中国企业联合会指导,亿欧·EqualOcean、工业与信息化科技成果转化联盟联合主办,以“科创4.0:共建全球化新未来”为主题,6000余名来自美国、英国、法国、澳大利亚、瑞士、以色列、俄罗斯、西班牙、葡萄牙、印度、新加坡等二十余个国家和地区的创新者齐聚一堂,共同总结2019年世界科学技术与产业创新的成果,预测2020年最新创新趋势。

  本次大会为期三天(12月6日-8日),采用“9+1”的会议结构,即于8日举办的“1”场创新领袖峰会,于6日和7日举办的“9”场主题论坛。9场论坛分别围绕当下最热门的零售新消费、金融科技、投资新趋势、智能硬科技、医疗大健康、产业互联网等领域,以及青年、女性和科学企业家等群体展开。

  在12月8日举办的创新领袖峰会上,眼神科技创始人兼CEO周军发表了主题演讲。他的主要观点如下:

  (1)多模态不是非此即彼的组合替代,而是基于数据融合的算法融合,并依托平台决策为支撑。

  感谢主办方的邀请。今天又站在这里,和去年不同,去年是讲人工智能,今天讲的是“十年一顾多模态”。这个单模态是什么,两模态是什么,三模态又是什么?多模态到底是什么?

  人工智能发展了这么长时间,大家对他的预期越来越接近真实的情况。刚刚一个朋友问我,人工智能到底发展到哪一步了?说实话,我不知道。我突然想讲一个小故事。养宠物的人很多,当你回到家里面,小狗会根据你的情绪做出一定的反应:你开心的时候,它会陪你一起开心;当你累的够呛在沙发上时,它会乖乖的呆在你的身边。我们家有一个小狗叫天球,如果昨晚它把你的拖鞋叼走了,当你早上醒来的时候,它会立刻叼回来;当你走向衣橱的时候,它会立刻跑到门口等着给你开门。这么简单的一个小狗,它能根据你的表情、行为时间,能判断出你是否开心并做出一系列的反应。

  我想给大家说一下,就这么一个小狗的智商,人工智能需要花多长时间做到?按照现在的人工智能,或者弱AI时代,没有20年很难做到这一步。这在某种程度上预示着,人工智能再过20年都很难达到小狗的水平,那么达到小孩的水平要多少年?

  让我讲讲多模态,眼神科技从事人工智能20多年,十多年前就在从事多模态的技术的落地,我有一些感想感悟、落地的案例和经验想分享一下。

  多模态在去年开始成为焦点,很多有名的公司比如说华为、腾讯、百度,这样的AI大厂,都开始逐渐的把目光瞄向多模态,很多勇于探索商业模式的公司也在思考这个方向性的问题。华为投资多模态语义理解的公司,腾讯的AI Lab的俞栋博士有那么一句话“多模态是迈向通用AI的重要方向”。通用AI是弱人工智能时代需要走向的一个方向,弱AI是 “见多识广”,解决的是感知的问题,通用人工智能具有几个属性:自学习、增量学习、增强学习,这些内容结合在一块,是强人工智能。从弱人工智能到强人工智能的奇点,截止目前还没有突破。 “见少知多”、“不见而预知”的强AI时代,这是很多年国际前沿人工智能公司一直努力的事情,技术遇到了天花板。

  多模态指的是多传感器融合,不是非此即彼的组合替代。指纹识别、人脸识别、虹膜识别、指静脉识别,每一个技术、每一个算法用一个传感器解决一个问题叫单模态。随着AI的发展、信息增加,AI被赋能被期待的模态慢慢的变多,比如文本识别,图片识别、文本和图片组合识别、图片和视频组合识别等,各种信息从不同的方位,不同的传感器到来,单一识别技术已很难满足这样的发展。

  如何解决识别误导和传感器感知局限问题,如何让机器像人一样感知和理解这样一个世界,我认为是多模态才能解决的问题。眼神科技致力于让机器和人交流的时候,使机器具有像人一样的眼睛,眼神科技因此而得名。

  国外知名的生物识别企业都在研究多模态,多模态慢慢的变成了生物识别发展的新趋势,EBA(欧洲生物识别行业协会)告诉我一个数据,到2023年欧洲生物识别的诉求达到115亿美金。依照我们公司去年的情况,我们的人脸、虹膜、指纹三种技术在公司业务中已形成了“三分天下“的收入角色。

  眼神科技在多模态生物识别领域已经耕耘了20年时间。从1998年到2005年,公司一直在做指纹识别,在这期间也发现了指纹存在的问题,于是和人脸进行融合。此阶段是公司指纹技术发展、指纹和人脸融合的发展阶段;2005年到2013年阶段,这也是我来北京创业的阶段。在这一段时期,公司利用成熟的指纹识别技术,打开了全国50%的银行市场。之后又开发人脸识别、虹膜识别技术,虹膜识别技术我们从2005年开始研发,到了2009年已达到了全球顶级程度,这是整个基础算法形成的过程。

  在面向市场的推广过程中,我们得知单一技术决策存在的一些问题,更需要打造分层决策,于是我们打造了ABIS多模态统一平台。整个公司研发技术过程中,我们获得了400多项发明专利,获得了国家技术发明二等奖。多模态决策体制是如何形成的?包含了融合算法,平台决策,ABIS平台三个方面,是基于数据融合的算法融合,并依托平台决策为支撑打造。

  眼神科技的研发一直是陪伴一个行业长大的,这个行业就是金融行业。公司在1998年就开始研究指纹,2002年,我们开始定位银行并且做试验。指纹的发展存在的最严重的问题,就是有很多人天生指纹浅、经常参加体育活动和体力劳动的人指纹也非常浅,举例有一个企业有20万人,其中1%的人指纹识别困难,用解决方案也没有办法解决。“科技不从善“让指纹识别技术遇到了巨大挑战,于是我不得不把指纹和人脸结合在一起处理问题。解决了银行内部风控的问题后,如何降本增效,如何获客成为银行发展的第二阶段。用人脸识别能解决获客问题,能做到人脸联网核查和VIP的识别。运营过程中又发现,尤其手机远端获客,在帮着银行减少相关成本和获客的同时,会遇到防伪的问题,人脸识别不能作为获客的单一的识别手段,于是我们把人脸和虹膜识别组合起来识别。随着银行开放和生态的建设,”追客”和”帮客”成为银行重要的需求,这对生物识别和人工智能提出更大的挑战。如何在场景中识别人、物、客,以及客户的真实需求的把握、精准营销如何去做,让银行服务进入你的消费空间,进入你的生活,这样的一个过程就需要生物识别技术的融合应用。今年,眼神科技中标了工商银行人脸识别产品引入和虹膜、指静脉算法提升服务项目,实现了指纹、人脸、虹膜、指静脉四项核心生物识别技术与工商银行全面合作。多模态是现在很多银行都在努力探索的方式。

  到目前为止,眼神科技通过多模态生物识别技术,服务全球2000多家客户,渠道客户1000多家。经历了二十年发展,在国内可以说是陪伴金融成长,也能说是被金融驱使,一刻没有停过,过去二十年一直在创新。总结一下,眼神多年的发展过程中,遇上问题、处理问题,用多种生物识别技术融合决策、多种技术解决一件事情。

  我认为多模态是长期发展的一个方向。希望更多的创新者,在各自领域的单模态上,好好的创新、耕耘,大家一起为AI未来的发展创造一个良好的环境,谢谢大家!