技术文章

当前位置:广东快乐10分预测 > 技术文章 > GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快

GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快

来源:http://www.btxygg.com 作者:广东快乐10分预测 时间:2019-11-01 09:55

赵海杰:头动范围是指摄像头如果正对你人脸,它两个中心如果重合的话,头动是指向左移、向右移,向上移、向下移这样的一个距离。我们一般定义是这样,但是因为相机的原因,我们会先确定在相机调校距离下头动范围是多大。基于这样的一个定义,头动范围我们是通过相机FOV确定,然后具体看应用场景的需要,我们可能会选取不同的相机然后去适配不同的头动范围,核心就是让相机去采集到可以用的眼图。

七鑫易维展示了应用最新眼皮检测模型的虚拟社交眼神交互场景,该场景复现了视线方向、眨眼、眯眼等眼睛活动,使虚拟角色看上去栩栩如生。新眼皮检测模型是七鑫易维利用深度学习技术,设计 24 层卷积以及 2 个全连接层的网络架构,在百万张规模的眼图数据集上,训练出高质量的眼皮检测模型,检测率能够达到 97% 以上,可以满足 VR 设备上和眼皮相关产品的应用需求。

广东快乐十分预测器 1

这里让我们一起快速回顾本次微讲座问答环节。

该虚拟驾驶系统和 ADAS 辅助系统可以有效针对汽车的辅助驾驶功能进行模拟驾驶,并进行分析研究。在 RealDrive 中,当你驾驶时间超过一定时长并且检测到你处于疲劳驾驶状态的时候,系统会及时发出提示,提醒你注意及时休息等信息。

上面的三张图,大家能看出哪个是真人吗?

原标题:车载眼球追踪微讲座问答实录 | Plug and Play移动出行独角兽加速计划

可变码率渲染技术的工作原理是基于眼球追踪传感器提供的用户实时眼动信息,动态改变着色像素的数量,对注视中央区域应用 100% 的 GPU 性能进行渲染,对周围区域应用较少的 GPU 性能进行渲染,从而可以节省 GPU 一倍以上的渲染计算量,提升渲染效率。光线技术普及应用后,渲染运算会节省更多,渲染画面会更加自然流畅。该技术已经与七鑫易维眼球追踪技术成功结合,成为新一代注视点渲染技术,将广泛应用于虚拟现实领域。

提问 1:刚刚提到人脸有 100 多个特征,我想问问你们现在用算法、深度学习的话,有没有办法可以有意识地去提取某些特征?因为深度学习的好多学习过程我们没法控制,有没有什么好的方法和办法?就是关注算法的学习过程,有办法去有意识的关注某些互位吗?

问题:2:七鑫易维有和车企一起做过疲劳和分神检测相关的业务吗?

英伟达NVIDIA 创始人 &CEO 黄仁勋在主题演讲中指出,Turing RTX 是英伟达 15 年来最伟大的创新,包含一项重要技术——可变码率渲染 Variable Rate Shading。

第三个,人脸关键点不等于人脸特征。

问题3:虹膜只用来Driver identification吗?Eye Tracking会用到虹膜吗?

北美时间 3 月 17 日至 21 日,一年一度的 GTC(GPU Technology Conference) 在美国硅谷举行。七鑫易维受邀参加本次大会并展示眼球追踪技术新成果。

在这两种攻击场景下,会有一些漏洞被我们捕捉到。第一个是露边框,手机屏幕在攻击或者打印照的时候,会露出边框;第二个是模糊问题,如果手机攻击离得非常近,边框没有了,但是画面会模糊。类似的还包括像素点、摩尔纹、手机屏反光,变形,扭曲等等问题。

确实疲劳的外在表现每个人都是不同的,这个怎么去判别,就像刚才回答第一个问题那样,首先不仅要结合眼动包括脑电等的疲劳度,结合医学上人们对疲劳程度的划分,每个人不一样,但是不一样它应该是属于某一个分布,比如说是正态分布还是高斯分布等等这样一些分布情况下,结合医学上能够定制一套基本上被大家认可的一个疲劳程度的标准,什么样程度下疲劳是什么样的一些情况,它的特征有哪些,不仅仅是眼动或者人脸关键点这样的一些程度,先把这个疲劳的定义或程度先定义出来,然后再去通过大量样本去分析,哪一种程度下人脸关键点跟眼球追踪一些生理指标的变化。

广东快乐十分预测器 2

第五个原因是摄像头模组制造工艺的突破。其实结构光在几年前就有了,但是并没有小型化到手机这么小的体积内,iPhone 是第一家推出这样设备的厂商。除了结构光之外,还包括普通的红外 IO 摄像头、TOF 摄像头、摄像头模组的小型化。

赵海杰:这个确实是有的,但是并不是说像刚才或者是行业内大家都认为的,人脸关键点是对驾驶员进行一个疲劳跟分神检测,我们现在是跟阿波罗,就是百度的无人驾驶车做的是属于自动驾驶环境下后排监测人员是否疲劳这么一个检测,通过眼球追踪做的,因为自动驾驶现在属于走在行业的前沿,如果发生危险是会成为整个行业的问题,大家比较关注,而且也发布了一些政策要求,每一个自动驾驶车辆必须要有一个后排监测人员。

眼动数据分析被逐渐应用到更广泛的商业领域和学术研究领域。房地产商可以通过设计虚拟现实样板间场景供用户体验,分屏显示客户选择房型的过程,实时获取用户在感受房间时的 3D 热图,更加直观体现客户兴趣点所在。在体验行为过后,通过系统后台生成包含 3D 移动轨迹、注视区域时长等其他内容的整体数据报表,供专业人员进行数据研究与分析,最终为 B 端用户优化消费者等用户体验。

在刷脸的活体技术上,去年我们做过的线上金融场景,遇到过这几类活体攻击。第一类是换脸攻击,比如说这个人脸上贴成另一个人的脸。第二个是屏幕翻拍攻击,类似于今年手机解锁攻击。第三个是通过计算生成一张 3D 假脸进行攻击。因为金融场景的特殊性,攻击手段层出不穷。我们也分别做出了不同类型的活体算法,来防御这些攻击。例如我们会要求用户摇摇头、眨眨眼,来判断当前进行操作的对象是不是一个“活人”。

赵海杰:首先需要将疲劳分为不同的等级,现在行业内还没有特别标准的行业都认可对疲劳等级的分配,我们可以设定一个程度,一个分数,比如说人闭眼5秒属于100%程度的疲劳,可能频繁的眨眼或者发呆这种程度大约是进行到疲劳的60%,这些方面首先要确定疲劳的程度,就是疲劳本身的这种等级的分类。目前行业内还没有这样的标准,我们不仅仅要结合眼球追踪跟结合车载,我们可能还要结合医学方面制定一些疲劳判定标准。

(图片来源:英伟达官网)

乔梁:您说的特征应该是指人脸关键点。说到部位,关键点要不要针对某些部位做特殊的训练,我觉得是由使用场景来定义的。举个例子,在美妆场景,需要做唇膏的上色和眼线的上色,对于眼睛和嘴唇的关键点要求非常高,所以需要针对这两个部位去增加更多的点,让上色变得更自然、更贴合。所以算法是由落地场景来驱动我们到底需要在哪些地方产生关键点,然之后再对数据进行标注、训练,最后才产生出来。场景是源头。

赵海杰:不仅凯迪拉克,前两天奥迪有一个Aicon概念车,上面就有用眼球追踪,它起的名字叫凝视选择,用眼睛注视它上面的一个按钮就可以实现确定,这也是比较火的一个应用。然后像凯德拉迪还有一款豪车,之前也提到了类似用眼球追踪或者人脸关键点去做这样的一个注意力监测的事情,都是前几年比较火的一个样车概念车,主要是从去年下半年到今年,尤其是今年,很多车企特别想把眼球追踪作为亮点的应用,大家一直都想做一些这样的落地,所以这两年是比较多、比较火的。

广东快乐十分预测器 3

乔梁,Face 产品专家,先后服务于小米、酷6、MySpace等互联网公司,负责过多款千万量级C端产品并两次获得苹果 App Store 推荐。目前在Face 负责人脸识别算法面向各行业的产品规划及落地,手机解锁项目负责人。

赵海杰:这些方面是有的,我们之前是有跟一个国内做手势识别的一家公司一起去给戴姆勒的加速营计划做过一个样车,当时就是用眼动去选定,用手势去确认这样一个DEMO,具体的研究跟产品我们都期望是跟合作商、合作伙伴一块儿去做,大家专业人做专业的事,这是有过一点经验的。

广东快乐十分预测器 4

手机解锁在今年终于爆发了,它其实是人脸识别多年经验积累的最终一个落地结果。我们先看一下手机安全的发展过程。

问题8:关于驾驶员注视的区域有定义吗?eye gaze zone会区分哪些跟驾驶相关,哪些属于distraction区域吗?

声明:新闻稿非映维官方稿件,所涉及任何法律问题均与映维无关

广东快乐十分预测器 5

(结束)返回搜狐,查看更多

黄仁勋还提到,数据驱动的数据科学研究法在计算机领域发展迅速,已经成为科学研究方法第四大支柱。他强调了应用数据科学研究法的三大要素:第一是庞大的数据采集量;第二是机器学习和深度学习算法的优化;第三是计算能力。

第二个问题,Iphone X 的前置结构光。前置结构光的基本组件有三个。第一个是 RGB 摄像头,第二个是散斑结构光的发射器,第三个是红外结构光摄像头。iPhone X 的摄像头要比我所说的还要复杂,但为了便于理解,我先从这三个组件的角度来介绍一下。第一个 RGB 摄像头是用来捕捉人脸画面进行人脸比对和正常拍照。另外两个设备都和结构光有关。结构光的原理是基于往你的脸上打一些红外光斑,并根据发射器和摄像头之间的相位差,计算出景深信息。由于这种景深信息的精度要远高于普通的 RGB 双摄,所以可以防御一些成本较低的攻击手段。除了机构光,还有 TOF,是根据红外光打到脸上反射回来的时间来判断人的远近和人脸 3D 的特性。这两种方案是安全性比较高的摄像头模组。

赵海杰:我刚才提的这种短期或者中期的时候都是属于摸索应用,您刚才提到对于注视区域的定义,现在只能说是大家基于经验去定性的,比如驾驶员正前方多少厘米乘以多少厘米是正常的一个注视的驾驶区域,向右侧多少厘米是一个驾驶区域,如果他要是分神了,他的注意力,驾驶的区域会在什么样的位置,他的变化是什么样的,这种情况目前来说行业内都还没有这种很好的标准化案例。所以,对于目前来看,这方面对于驾驶员注视区域的一些定义都是不成熟的,都是大家目前基于经验去监测的。

基于 RTX 技术,黄仁勋还发布了数据中心级别的图像服务器 NVIDIA RTX Servers,它能够支持渲染、Omniverse 和 Geforce Now 云端游戏服务,在云渲染、效率和规模上实现了飞跃。七鑫易维 VR 云注视点渲染解决方案结合了 VR 云渲染和注视点渲染两种技术,在用户运行 VR 内容时,基于注视点在云端进行画面渲染,可以缩短渲染延迟,并大大降低用户成本。

-全文完-

赵海杰:虹膜方面,一般来说虹膜是做身份验证,用眼球追踪 虹膜其实都是属于采集眼部图像,一般来说眼球追踪采集的眼部图像是可以同时做虹膜识别 眼球追踪,所以Eye Tracking本身是会考虑用虹膜,但是主要是结合虹膜去做身份验证,采集同样的一张眼图,分别做两件事情。我们会把眼图给到像国内做虹膜识别比较不错的合作商,像合作商中科虹霸这块他们去做身份认证,然后我们同步去做注视感知、注视追踪这样一些事。

GTC 2019| 七鑫易维眼球追踪助力 AI 驱动未来最先出现在映维网。

广东快乐十分预测器 6

总结来说,如果我们的盲人朋友是百分之百盲的这种朋友,在做眼球追踪的时候是几乎不太可能的,但是确实有一些弱视或者弱视程度比较高,他能注视出相应的方位或者一个方向,但是他看不清,他可能是10%或者20%程度的这种盲,这种方向我们可以估计他的注视方向。确实有一些做弱视眼镜的朋友也联系我们,就是用眼球追踪估计弱势这种10%或者20%盲的这种朋友注视的方向,然后用摄像头把注视方向的景物拍出来放到近处的眼镜上,这样可以减轻弱势群体看远处景物的问题,这种情况下眼球追踪是可以起到一定的作用,或者你认为他可以识别出。

眼球追踪技术新成果

广东快乐十分预测器 7

赵海杰:如果盲人的眼球是完全不可见的,他眼球如果是非正常的,就是例如有的盲人朋友可能眼皮把整个眼球都遮挡了,这种情况因为采集不到眼图,你不知道他注视的方向,这个是做不了眼球追踪的。但是如果有的盲人就看他的眼疾是属于什么样的疾病,如果只是说视网膜什么位置有一定的问题,但是他瞳孔基本上是可以正常转动,一个眼睛是正常的,另一个眼睛非正常,他在看一个位置的时候正常的眼睛注视向那个方向,不正常的眼睛瞳孔方向也可以指向那个位置,目前来说我们倒没尝试做过这方面的事,但是可以研究这种情况下,非正常的眼球如果也能指向注视位置的话,确实可以追踪到。但是可想而知,这种追踪不一定是比较精准的,也许他有正常的光斑中心跟瞳孔中心,但是这可能会跟正常的眼睛是有区别的,不太确保他是否能准确或者相对准确的追踪到不正常的那只眼睛。

在本次 GTC 上,七鑫易维展示了与 RealDrive 联手推出的,结合可变码率渲染技术与 VR 技术的虚拟驾驶模拟系统。RealDrive 虚拟驾驶模拟系统包括 Cybertron 虚拟训练场,能够真实还原现实生活中的道路场景和交通路况给用户带来身临其境的全方位虚拟驾驶体验感。

所以在手机解锁的场景下需要进行防范,首先需要定义攻击场景有哪些。

长远来看这件事情去做,我想应该还是属于中期或者长期去设定驾驶员疲劳区域,这个应该会基于很多实际的落地的一些数据,比如说什么样的人,什么样场景,货车、轿车,什么样的驾驶员,什么年龄段,他们分别常用常规的注视区域会是在什么位置,基于这样的大数据分析出来。然后非常规的驾驶区域会是什么样的情况,他们的驾驶场景是什么样,这些得需要一段时间去积累。当然这些应该都是属于第二阶段或者第三阶段要做的事,短期来说要做的事儿就是先找到可以让眼球追踪定性能落地的DEMO的点,第一步做好了再会去做第二步,像驾驶员注视区域的一些内容。

广东快乐十分预测器 8

常见的生物识别,除了指纹、虹膜还包括指静脉、巩膜、视网膜等一些生物识别特征。传统生物识别所采集到的都是隐私的特征,所以人脸是个比较另类的生物识别方式,它采集到的是一个没有那么隐私的数据,因为在我们日常生活中,你很容易暴露自己的照片。

责任编辑:

广东快乐十分预测器 9

问题7:能识别盲人的眼球吗?

广东快乐十分预测器 10

广东快乐十分预测器 11

第二个,红外摄像头是不是更安全?

问题6,如何界定疲劳识别的敏感性?怎样解决因传感器过于敏感而使驾驶员感到烦躁的问题?

广东快乐十分预测器 12

问题5:怎么判定人属于哪个等级的疲劳?疲劳的外在表现每个人是不同的,你们怎么定义判别呢?

作者 | 乔梁

编辑 | Vincent

AI前线出品| ID:ai-front

问题1:七鑫易维有没有做过人脸识别跟手势识别方面的研究跟产品?

今年有两款代表性的手机发布,让人脸这种生物识别技术站到了台前。第一个是上半年发布的三星 S8,三星 S8 是前置单摄的解锁方案,也就是今年最普及的人脸解锁方案;第二个是 iPhone 10。iPhone 10 是前置结构光双摄的解锁方案,这个代表着人脸解锁的未来趋势。

前言:在“车载眼球追踪微讲座精彩呈现 | Plug and Play移加速计划”(点击“阅读原文“回顾)中,七鑫易维产品经理赵海杰向我们展示了眼球追踪技术原理及现状。

广东快乐十分预测器 13

问题4:头动的范围一般是怎么确定的?

那么是什么因素推动了今年的人脸解锁成为手机解锁的主流呢?

(讨论)最近凯迪拉克CT6的超级巡航比较火,里边应该就有这个分心检测。

第三个是芯片处理能力的提升与人脸识别算法的成熟。一些硬件层的加速方案可以让人脸识别的算法能在手机上跑得更快,新的活体技术可以让刷脸变得更安全。这在后面会具体来讲。

进一步说一下头动范围,其实我们确定头动范围第一是先根据场景的需求,比如对驾驶员的话,驾驶环境头部向左移20厘米,向右移10厘米这样一个范围是在左右移动范围,向上大约是10厘米,向下大约是10厘米这样一个范围。我们会基于驾驶员这样一个用户驾驶的场景所确定的一个头部移动的这样一个范围,去选一些相机,对相机进行选型确定,保证相机始终能在这样的视角范围能精确或者是比较合适的采集到可以用算法用的眼图。

刚才我们给机器提供了大量的攻击数据让它去训练,机器看多了数据,它就自然能辨别哪些是攻击数据了。所以,机器最终做到的活体防御水平,要远远超过这 6 种我们肉眼也可以分辨的场景,在活体防御上,机器要比我们的肉眼靠谱得多。

其次我们再去做结合眼球追踪或者结合人脸关键点去做疲劳驾驶判定。结合人脸关键点和眼球追踪去做这种疲劳程度的判断,这需要再结合不同疲劳程度下,绝大多数或者大量的人脸关键点的变化,和人脸眼球生理指标的一些变化,这样去判定他是属于哪个等级的疲劳。总结一下这个逻辑,就是先去判断在正常疲劳分为什么样的一些程度,去定一些标准,这个可能要结合医学上的一些指标去定一个行业内认可的疲劳标准。其次,再去看每一个程度或者每一个阶段下疲劳中关键点,人脸关键点变化情况,和眼球的一些生理指标变化情况,这个是需要样本去验证测试的,目前来说大家定量做的还很少,行业内认为2021年可能人脸关键点疲劳点测试已经是商用落地比较好,但是要在高层次或者更精细的去落地的话可能还有点距离。

第一步,我们拿起手机,采集视频序列帧,这时候需要检测这些帧有没有人脸,需要找到人脸。

赵海杰:我们一般进行疲劳识别或者判断用户是否疲劳,现在的方式是通过时长,比如说这个人闭眼3秒,闭眼5秒就认为是一个阶段性疲劳,如果对于疲劳识别敏感性进行定义的话,我们可以通过时长去界定,超过这个时长是疲劳识别,达到疲劳了。第二个是通过注视轨迹的这样一个变化,比如说是正常人遇到不同路况,那反映是比较敏锐的,从一个点能够迅速移动到另一个点。如果是疲劳的人移动速度和变化的轨迹是跟正常的人是不一样的,我们通过做一些室内的实验,之前我们在室内有做过疲劳状态下人阅读或者是看一些显示界面的一些注视轨迹,跟移动速度,是跟正常非疲劳状态下是不一样的,这个时候是可以能发现的,有这样一个实验。可以通过像时长还有轨迹的停留、轨迹的移动变化去界定疲劳识别是否达到疲劳,是否已经构成敏感程度。如果传感器过于敏感,我们就通过刚才这样的一些指标,一些眼动的生理指标,可能会结合人脸关键点的一些指标同步去判断一些疲劳,就是判断相对精准了,驾驶员就不会有感觉到烦燥这样的问题。

讲师介绍

广东快乐十分预测器 14

人脸识别大家应该很早之前就听说过,但是实际上这技术的历史并不是特别长。2001 年人脸的检测刚刚做到可以在 PC 上实时运行,但没有用到深度学习。2005 年的时候,欧姆龙第一次把人脸检测做到了一台相机里面,这样相机在拍照的时候就可以对人脸进行对焦。2012 年的时候,清华有三个同学,大家一起做了一款游戏 APP,这个游戏会根据你的头上下摇动来控制游戏里的主角,这是第一款基于人脸进行控制的游戏。这三个同学就是我们的三位创始人。在手机上能运算人脸识别算法,这对于之前又是一个很大的提升。2015 年的时候,马云在汉诺威展上展示了支付宝刷脸支付的方案。大家都知道,支付对于安全有很高的要求,在这个方案里用到了各项人脸技术,包括人脸检测、人脸识别和各项活体检测。但这个方案一直到今年才开始商用,在这几年间刷脸支付得到了突飞猛进的发展。我们去年推出了一个产品,叫做 FaceID。大家在使用支付宝或者一些金融产品时,有时候手机会要求你做一些配合式动作,比如眨眼、摇头,这就是 Face ID 做的事情。眨眼、摇头不是用来做人脸识别的,是用来做活体检测,判断人是不是活人。

正确答案是最后两张是真人。第一张其实很难分辨,但颧骨有个鼠标指针;第二张是这个人背景虚化了,真实摄像头是不会采集到背景虚化的人;第三个是我们将照片打印出来剪出来在摄像头面前拍;然后第四个是屏幕翻拍。

问答环节

手机解锁对活体提出了更高要求。因为解锁需要拿起手机就完成检验,用户不会愿意为了解个锁还要摇摇头、眨眨眼。怎么让手机在那么短的时间内、没有任何配合动作的条件下,也能分辨出你的真伪呢?

广东快乐十分预测器 15

我觉得最主要的因素是工业设计和制造工艺的提升。今年的全面屏成为工业设计上的主流趋势,大指纹设计挪到了手机背面,指纹的用户体验优势降低了。人脸不仅弥补了体验上的不足,更重要的是,人脸只需要摄像头就可以完成,不需要像指纹一样占用更多屏幕面积,所以能够大大提高屏占比。

乔梁:我先回答第一个问题。先给大家解读一个误区,人脸关键点和人脸特征值是两个东西。关键点是人脸上的点位,它的应用场景通常是一些娱乐场景,比如说做贴纸、做美颜。而人脸特征与关键点无关,它是针对人脸进行一串编码,我们每张脸都有一串人脸编码,针对这串编码来比对当前这张脸和你是不是同一个人,所以这不是同一个东西。您看到的 “半张脸都可以” 的场景,我猜想应该是指的人脸关键点。关键点分两步,第一步叫关键点的检测、第二步叫关键点的跟踪。检测就是原来画面里没有人脸,后来出现了人脸,观察能不能把关键点检测出来,在检测方面,如果你的面部有大面积的遮挡会是比较困难的,所以在检测第一帧画面的时候,脸部还是要尽量保持完整,跟踪的时候关键点有很强的鲁棒性,一旦检测到人脸,我的脸甚至于遮住半张脸都没有受到影响。

手机常见的攻击场景,第一个是屏幕翻拍攻击,第二个是照片打印攻击。

上面那张还比较简单。这张图呢?

如上图所示,大家可以看到右上角的图,左边的人脸是个硅胶的三维人脸,有一个真人的手里着一张纸,纸上有打印出来的 2D 人脸。散斑结构光打在这些材质上会产生光斑,我们把采集到的结构光光斑的画面进行运算后,可以很有效的判断出了哪个材质是硅胶、哪个材质是人手、哪个材质是纸张。我们未来会有更多的新技术,来提升手机刷脸支付场景的安全性。

http://t.cn/Rl2MGtT

如上图所示。大家觉得比较安全的指纹和虹膜,其实也可以被攻破。关于指纹攻击,网上可以买到几十元的硅胶模,只要有机会取到机主的指纹图像,翻印成硅胶模就可以解锁通过了,因此现在指纹模组也做了活体的优化,比如判断当前手指的血液流速,从而证明你是活人。而关于虹膜,如果打印高清照片再配合一副隐形眼镜,也能进行攻击。

如上图,从一张图像的数据量来看,普通摄像头采集到的画面数据量要远远大于红外摄像头的数据量,所以,并不能简单地说红外更安全。但红外摄像头确实可以提高安全性,它的安全性主要体现在对 RGB 的补充上。我们肉眼只能看到 RGB 图像,而红外光是我们人眼不可见的光。通过红外光图像,我们可以有效辨别到底哪些是人脸,哪些是手机屏。另外红外光可以辅助在暗光的场景下进行解锁,对体验也有帮助。

今年除了苹果外,所有的解锁方面都是解锁级的方案,遇到支付场景,还是需要依靠指纹或密码来完成。我们认为人脸解锁的未来是人脸支付。而在支付上,只有特定的摄像头硬件方案才能达到这种安全水准。例如苹果所采用的结构光。

最后一个原因是用户体验,大家在刷脸解锁的过程中不需要做任何的配合式操作,可以拿起手机直接解锁。而刷脸还可以抵抗一些常见的干扰,例如暗光、侧脸、小范围遮挡等。这让刷脸成为一种体验更优的生物识别方案。

提问 2:我有两个小问题,刚刚有介绍到识别特征区域是轮廓、眼睛、嘴巴,其实我体验了很多人脸识别的设备,但一般戴口罩就很难识别出来,然而有些半张脸都可以,那为什么在戴口罩这块的识别效果会降低很多呢?另外一个问题,刚才讲到 Iphone X 是前置结构光捕捉三维动画,那块能详细介绍一下吗?

前面有提到,刷脸支付在今年才真正落地。在杭州的一家肯德基门店,已经布上了一台刷脸支付机,用户不用带钱包和手机,只需要跑到机器前刷脸就能够完成支付。在这台支付设备的顶上安装的是结构光摄像头。

说到用户体验问题,我们来对比一下现在最常见的手机解锁方案的体验。


第一个,我们经常遇到一些问题,人脸识别安全程度打几分?指纹几分?安全标准从来不是可以用百分比数字来简单衡量的。判断安全的标准是成本。我们拿锁来举例,A 级锁的攻击成本是一分钟内就可以去攻破;B 级锁的供给成本差不多要 5 分钟;有 C 级锁,即金库用的锁,需要花三个小时才能够把锁给攻破。所以说安全的标准,其实是你的攻击成本。iPhone X 的安全性更高,不是说他的人脸识别率比单摄手机高了多少百分点,而是他的攻击成本更高。因为结构光摄像头可以防御所有的平面攻击手段,攻击者需要造出立体的人脸模型才能攻击。

如上图所示,从另一个角度来讲,我们人眼很难辨别这些指纹图像是不是一个人,但我们能够很轻松地知道右边这些图是否属于同一个人。在我们人脑中有个区域叫梭状回,这个区域就是用来做人脸识别的。梭状回出了问题,就是俗称的脸盲症,得了这个病的人就没法做人脸识别。以上观点是想说明人脸相比其它生物识别是缺少私密性的,而且人脸更适合由人脑来做识别。所以将人脸识别放到解锁上来做,需要更强的鉴别真伪的手段。

GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快乐十分预测器。人工智能已不再停留在大家的想象之中,各路大牛也都纷纷抓住这波风口,投入AI创业大潮。那么,2017年,到底都有哪些AI落地案例呢?机器学习、深度学习、NLP、图像识别等技术又该如何用来解决业务问题?

广东快乐十分预测器 16

第二个原因是成本和收益问题,如果厂商想要在手机那么小的空间内装一个指纹模组、虹膜模组,所要牺牲的手机内部空间占用,换句话说所需要的成本是巨大的。而人脸识别不会占用除摄像头模组外更多的内部空间。

下面说几个人脸识别中常见的误区。

那什么是活体检测?活体检测背后用到了哪些技术?

如上图所示,左边是关键点。我们拿出 10 个人的关键点来比较,可以发现每个人的关键点是非常相似的,因此通过对比关键点非常不靠谱。人脸特征是指对人脸的一串编码数据,你可以想象成有一个多维空间,每张人脸是多维空间的一个点,如果采集到了你多张人脸的照片就是多个点,那么点之间的距离越近就越可能是同一个人,越远就越可能不是同一个人,我们的逻辑是这样计算的。

结构光双摄,主要的原理是通过结构光的发射器和接受器之间产生的相位差来计算出人脸的深度,并且针对这个深度来判别真伪。所以从结构光硬件本身是能够防御所有的 2D 攻击手段,包括屏幕和纸张。但由于支付场景的敏感性,攻击者可能采用 3D 打印或者硅胶膜此类成本更高的攻击手段来窃取机主的财产。 这便需要我们这样的算法公司去解决该类活体问题。

首先在底库采集方面,人脸解锁只需要采集一张照片就可以了,但指纹需要采集多张。虹膜相对比较快,但虹膜需要把手机举到面前然后等几秒钟。从解锁速度来看,人脸解锁速度是最快的,拿起手机直接解锁,而指纹需要按到感应器,虹膜也需要对齐眼部。指纹解锁存在一些常见的干扰,比如指纹在手湿的时候完全不能解锁,戴手套也不能解锁。虹膜解锁的时候,戴隐形眼镜或者对着阳光直射也会受到干扰。人脸识别也存在干扰场景,比如说晚上家里灯全关了,或者戴墨经、双胞胎等等都会干扰,而我们现在解锁已经做到通过点亮屏幕的亮度就可以进行解锁。因此人脸在整个体验上比较具有优势。

大家好,我是乔梁,来自 Face 。我今天分享的内容可能偏干货多一点,主要介绍一下人脸解锁的具体技术。

GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快乐十分预测器。那么人脸识别背后到底用了哪些技术?我们看一下手机解锁的流程。

2018年1月11-14日,AICon全球人工智能技术大会上,一些大牛将首次分享AI在金融、电商、教育、外卖、搜索推荐、人脸识别、自动驾驶、语音交互等领域的最新落地案例,应该能学到不少东西。目前大会8折报名倒计时,更多精彩可点击阅读原文详细了解。

从 2008 年第一台苹果手机的发布到现在已有将近 10 年的时间。在 2009 年时候出现了密码解锁;在 2010 年的时候了出现图形锁之后出现了很多生物识别技术(见图中蓝色字体)。生物识别的出现,最主要目的是为了解决用户体验,因为时常需要输入密码很麻烦,画一个图形解锁也很麻烦,在 2013 年有了指纹解锁之后,大家手指一按马上就可以解锁了。指纹、人脸识别、虹膜都是为了解决体验性问题。

如果一个人有指纹、有虹膜,他是活体吗?他不是活体,因为光有指纹和虹膜还不够,你还需要辨别这个人是否还“活着”。比如,他的手指是热的吗?手指下的毛细血管里有血液在流动吗?这就是活体要解决的问题。所以可以看到,其实任何一种生物识别方式,对活体的判别是基于人的一些先验知识。不管是人脸,指纹还是虹膜,其实现在只能从这些先验知识入手进行判断,如同管中窥豹,都存在很大的局限性。

乔梁:手机摄像头硬件方面,首先单 RGB 摄像头是一直以来的重点,因为从应用场景来看, 70% 以上的手机都是依赖于单摄的。除了单摄之外,目前重点关注的是结构光与 TOF,即 iPhoneX 的方案。因为它能将人脸解锁提升到支付级;另外,从摄影的角度,我们也在关注 2PD 的技术。它其实是一个单摄,但它的 sensor 将一个像素拆成了两个次像素,所以它可以采集到两张画面。这两张画面对齐后,会发现有非常细微的角度差异,我们将角度放大之后,可以让单摄达到类似于双摄的效果,获得一些景深信息。因此我们认为 2PD 会是双摄的一种低成本替代方案,可以在一定程度上提高人像虚化的质量。

GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快乐十分预测器。说完用户体验,我们来说一下解刷脸这件事到底安不安全。

广东快乐十分预测器 17

第二步,分析人脸上的一些属性,包括人脸眼睛的睁闭状态,头的角度等情况,根据这个去判断其到底适不适合解锁。比如眼睛闭着的时候就不适合解锁,因为这说明是别人在拿着我的手机对着我拍。第三个技术是活体检测,我们需要通过画面进行判断你到底是本人在用手机,还是别人在拿着你的翻拍照片进行解锁。第四项技术是人脸识别,我们通过把底库的照片和这一帧所提取出来的人脸特征进行比对,判断到底是不是属于同一个人。

人工智能分为两个阶段,首先是感知阶段,然后是认知阶段。目前整个人工智能还在比较初级的感知阶段,而最主要的两种感知途径就是视觉和听觉,目前我们主要做的是视觉方向。我们公司成立于 2012 年,在视觉方向研究了很多年,一直专注以人脸为核心的方向,那么为什么我们会做人脸呢?在我们看来,人脸是信息量最大、商业价值最高的图像数据,我们可以通过一张图像知道一个人的年龄、性别、颜值、以及该人是否为他本人等等很多信息。

为了同时解决体验问题和安全问题,我们做出了一项新的突破性的活体技术。具体原理不方便多说,可以给大家看一下下面这张图。

提问 3:我想问一个问题,您这边的话对于人脸识别从传统单摄像头到后来的深度摄像头以及现在这种包括结构光的摄像头,下一阶段 Face 关注的趋势是什么样的?谢谢。

AI 前线导语:“目前市面上有很多产品,比如:支付宝,美颜相机还有人脸解锁功能等等,很多都是应用了Face 的技术。本文的作者乔梁先生,将从自己作为产品专家的角度,详细解析人脸解锁的前世今生”。

广东快乐十分预测器 18

展望未来,我们认为刷脸支付的场景未来会拓展到各行各业,因为刷脸不需要配合,也不需要做任何的操作,用户没有感知就可以完成,所以不仅是线上可以用来做支付,线下可以在新零售、无人超市,用刷脸来解决支付问题。

本文由广东快乐10分预测发布于技术文章,转载请注明出处:GTC 2019| 七鑫易维眼球追踪助力 AI 驱动今后广东快

关键词: 公司 助力 摄像头 自动驾驶