人脸检测 - 也称为面部检测 - 是一种基于人工智能 (AI) 的计算机技术,用于在数字图像中查找和识别人脸。人脸检测技术可应用于各个领域——包括安全、生物识别、执法、娱乐和个人安全——以提供对人员的实时监控和跟踪。
人脸检测已经从基本的计算机视觉技术发展到机器学习 (ML) 的进步,再到日益复杂的人工神经网络 (ANN) 和相关技术;结果是持续的性能改进。现在,它作为许多关键应用程序的第一步发挥着重要作用——包括面部跟踪、面部分析和面部识别。人脸检测对应用程序中顺序操作的执行方式有重大影响。
在人脸分析中,人脸检测有助于识别应关注图像或视频的哪些部分,以使用面部表情确定年龄、性别和情绪。在面部识别系统中——它以数学方式映射个人的面部特征并将数据存储为面部印记——算法需要面部检测数据来识别需要图像或视频的哪些部分来生成面部印记。一旦被识别,新的面部印记可以与存储的面部印记进行比较以确定是否存在匹配。
人脸检测的工作原理
人脸检测应用程序使用算法和机器学习在较大图像中查找人脸,这些图像通常包含其他非人脸对象,如风景、建筑物和其他人体部位,如脚或手。人脸检测算法通常从搜索人眼开始——这是最容易检测的特征之一。然后该算法可能会尝试检测眉毛、嘴巴、鼻子、鼻孔和虹膜。一旦算法得出结论它已经找到了一个面部区域,它就会应用额外的测试来确认它实际上已经检测到了一张脸。
为了帮助确保准确性,算法需要在包含数十万正负图像的大型数据集上进行训练。训练提高了算法确定图像中是否有人脸及其位置的能力。
人脸检测中使用的方法可以是基于知识的、基于特征的、模板匹配的或基于外观的。每个都有优点和缺点:
基于知识或基于规则的方法根据规则描述人脸。这种方法的挑战在于难以提出明确定义的规则。
特征不变方法——使用人的眼睛或鼻子等特征来检测面部——可能会受到噪音和光线的负面影响。
模板匹配方法基于将图像与先前存储的标准面部图案或特征进行比较,并将两者相关联以检测面部。不幸的是,这些方法没有解决姿势、比例和形状的变化。
基于外观的方法采用统计分析和机器学习来寻找人脸图像的相关特征。该方法也用于人脸识别的特征提取,分为子方法。
面部检测中使用的一些更具体的技术包括:
去除背景。例如,如果图像具有纯色单色背景或预定义的静态背景,则移除背景有助于显示面部边界。
在彩色图像中,有时可以使用肤色来寻找人脸;然而,这可能不适用于所有肤色。
使用运动来查找面孔是另一种选择。在实时视频中,人脸几乎总是在移动,因此使用这种方法的用户必须计算移动区域。这种方法的一个缺点是存在与背景中移动的其他物体混淆的风险。
上面列出的策略的组合可以提供一个全面的人脸检测方法。
由于姿势、表情、位置和方向、肤色和像素值、眼镜或面部毛发的存在以及相机增益、照明条件和图像分辨率的差异等因素的可变性,检测图片中的人脸可能会很复杂。近年来,使用深度学习的人脸检测取得了进展,其优势显着优于传统的计算机视觉方法。
人脸检测方法的重大改进出现在 2001 年,当时计算机视觉研究人员 Paul Viola 和 Michael Jones 提出了一个框架,以高精度实时检测人脸。Viola-Jones 框架基于训练模型来理解什么是人脸,什么不是人脸。训练完成后,模型会提取特定特征,然后将这些特征存储在文件中,以便可以将新图像中的特征与之前存储的特征在各个阶段进行比较。如果所研究的图像通过了特征比较的每个阶段,则已检测到人脸并且可以继续操作。
尽管 Viola-Jones 框架在实时应用程序中用于识别人脸仍然很流行,但它有局限性。例如,如果一张脸被面具或围巾覆盖,或者如果一张脸没有正确定向,则该框架可能无法工作,那么算法可能无法找到它。
为了帮助消除 Viola-Jones 框架的缺点并改进人脸检测,已经开发了其他算法——例如基于区域的卷积神经网络 (R-CNN) 和单镜头检测器 (SSD)——来帮助改进流程。
卷积神经网络 (CNN) 是一种用于图像识别和处理的人工神经网络,专门用于处理像素数据。 R-CNN 在 CNN 框架上生成区域提议,以对图像中的对象进行定位和分类。
虽然基于区域提议网络的方法(如 R-CNN)需要两个镜头——一个用于生成区域提议,另一个用于检测每个提议的对象——但 SSD 只需要一个镜头来检测图像中的多个对象。因此,SSD 明显快于 R-CNN。
人脸检测技术的优点
作为人脸识别和人脸分析等人脸成像应用的关键要素,人脸检测为用户创造了各种优势,包括:
提高了安全性。人脸检测可改善安防监控工作并有助于追踪罪犯子,保障和增强公共场合的安全。
易于集成。人脸检测和人脸识别技术易于集成,大多数解决方案兼容大多数安全软件。
自动识别。在之前,识别是由人手动完成的,效率较低,而且常常不准确。AI人脸检测技术允许自动识别过程,从而节省时间并提高准确性。
人脸检测技术的缺点
虽然人脸检测为用户提供了几大好处,但它也存在各种缺点,包括:
海量数据存储负担。人脸检测中使用的 ML 技术需要强大的数据存储,但并非所有用户都可以使用。
检测易受干扰。虽然人脸检测提供比手动识别过程更准确的结果,但它也更容易被外观或相机角度的变化所干扰。
潜在的隐私泄露。人脸检测技术为协助公安等部门追踪罪犯等提供了巨大的帮助。 然而,由于开发门槛不高,技术滥用也存在隐私泄露问题,必须制定严格的法规,以确保公平使用该技术并符合人类隐私权。
人脸检测与人脸识别
尽管人脸检测和人脸识别这两个术语经常一起使用,但人脸识别只是人脸检测的一种应用——尽管是最重要的应用之一。面部识别用于解锁手机和移动应用程序以及生物特征验证。银行、零售和运输安全行业采用面部识别来减少犯罪和预防暴力。
简而言之,术语人脸识别超出了检测人脸的存在以确定它是谁的脸。该过程使用计算机应用程序捕捉个人面部的数字图像——有时是从视频帧中获取的——并将其与存储记录数据库中的图像进行比较。
AI人脸检测技术的用途
尽管所有面部识别系统都使用面部检测,但并非所有面部检测系统都用于面部识别。面部检测也可用于面部动作捕捉,或使用相机或激光扫描仪将人的面部动作以电子方式转换为数字数据库的过程。该数据库可用于为电影、游戏或化身制作逼真的计算机动画。
人脸检测还可用于自动对焦相机或计算进入某个区域的人数。该技术还具有营销应用——例如,在识别出特定面孔时显示特定广告。
面部检测的另一个应用是作为情感推理软件实现的一部分,例如,可以用来帮助自闭症患者了解周围人的感受。该程序使用高级图像处理“读取”人脸的情绪。
另一个用途是从视觉线索或“唇读”中得出语言推理。这可以帮助计算机确定谁在说话,这可能有助于安全应用程序。此外,人脸检测可用于帮助确定图像的哪些部分需要模糊以确保隐私。
当前,AI人工智能和机器学习在安防领域的落地场景最多,如:安防监控、视频中的人脸检测、人脸识别、人流量统计等,广泛应用在小区、楼宇的智能门禁,周界可疑人员徘徊检测、景区人流量统计等等。
TSINGSEE青犀视频基于多年视频领域的技术经验积累,将AI检测、智能识别技术融合到各个应用场景中,典型的示例如EasyCVR视频融合云服务,具有AI人脸识别、车牌识别、语音对讲、云台控制、声光告警、监控视频分析与数据汇总的能力。