人工智能人臉識别技術摘要-tft每日頭條

一.生物識别技術定義

生物識别技術主要是指通過人類生物特征進行身份認證的一種技術,即利用人體固有的生物特性,如人臉,指紋、虹膜、掌紋、指靜脈等和行為特征,如筆迹、聲音、步态等來進行個人身份的鑒定。由于人類特征通常具有唯一性、便攜性或終身不變等特點以方便自動識别和身份驗證,因此生物識别認證技術較傳統認證技術存在較大的優勢。具體來說,生物識别系統是對生物特征進行取樣,提取其唯一的特征并轉化為數字代碼,并将這些代碼組成特征模闆,通過微處理器和各種電子元器件提高精度,将生物識别系統廣泛的應用在各個領域。

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）1

二.生物識别技術和人工智能的關系

生物識别是人工智能的感知層和入口。

在人工智能産業鍊中,生物識别是人工智能領域的一種應用技術,而且是人工智能領域裡應用場景較為廣泛的技術。作為人工智能的感知層,為各應用領域和技術領域采集生物特征數據;作為人工智能的入口,通過身份認證,實現人工智能“識人”的第一步。此外生物識别技術本身又利用人工智能領域的大數據技術和深度學習算法技術來實現技術的不斷叠代升級。因此生物識别技術既是人工智能領域的重要一環,二者又是相輔相成的關系。

三.全球生物識别市場規模

我國生物識别市場規模從2002年起十幾年間一直保持高速增長,人工智能産業是從15年起步,2019年進入起步期,未來十年将是人工智能産業競争的重要窗口期。随着人工智能産業的騰飛,生物識别也将迎來更廣闊的市場潛力。MarketsandMarkets最新發布的研究報告顯示,2020全球生物識别市場規模達到366億美元,預計到2025年将增加至686億美元,在預測期内(2020—2025年)的複合年增長率為13.4%。

四.生物識别技術商業化進程的關鍵驅動

人工智能大數據深度學習算法和多模态識别技術為生物識别技術提供深層次的支持,是生物識别技術商業化進程的重要推動因素。

1.深度學習算法

在生物識别領域,是通過模拟腦科學中神經元之間信息流的傳播方式,抽象出一種數學模型,它可以通過端對端(End-to-End)的訓練,從不同的抽象層級提取數據的本質特征,從而完成複雜的分類或回歸任務。此外,深度學習算法還能不斷優化算法訓練,自動學習到精準的表征,形成具有深度的結構模型,增強表達能力、提高效率。

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）2

2.多模态識别

人類時刻通過視覺、聽覺、嗅覺、觸覺在内的多個感官與世界産生交集,其中所包含的每一種信息形式—視頻、圖像、文字、語音、味道、質感等都是一種模态。通過融合人體多種生物特征進行身份識别的技術就是多模态識别,人工智能不再局限于單一模态下的交互,可以像人類一樣同時感知多種類型信息,身份認證及識别過程會更加精準、安全,整體系統的性能提高,滿足不同的應用場景。

五.生物識别技術應用

目前生物識别技術已經得到廣泛應用,按照人體的不同生物特征劃分,可以分為指紋識别、人臉識别、虹膜識别、語音識别、掌紋識别、唇語識别、指靜脈識别、步态識别等。

按照應用領域劃分,主要應用于智能駕駛、智能安防、智能家居、智慧城市、智慧校園等場景。利用不同生物識别技術的特點和各自獨特的優勢,可以滿足不同應用場景的需求。

六.常見生物識别技術的特點與難點詳解

生物特征識别技術應用中,應對不同生物特征,可能會選用不同的識别技術,每一種技術都有其特點和優勢,下文以智能駕駛車載場景為例,分析不同生物識别技術的特點與難點。當然,多模态識别技術是最火爆的發展方向,正在越來越多的商業場景落地。

1.人臉識别技術

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）3

●技術特點

人臉識别技術可以在較低的畫質、較大的偏轉角度以及部分遮擋的情況下,迅速的匹配底庫中的數據,實現智能化的體驗。可以輕松實現毫秒級的人臉檢測,支持彩色、灰度、近紅外等各種圖像和視頻類型,支持根據證件自動錄入海量數據。可以适應側臉、部分遮擋、表情變化、發型、妝容、眼鏡、複雜光照場景等變化。并且具備完善的活體檢測技術,防止2D/3D的惡意攻擊。

●應用難點

成像問題:攝像頭需要捕捉到用戶的人臉,成像質量較差的情況下,直接影響識别率。通過紅外照明技術,已經可以在無感的情況下解決夜晚的人臉識别問題。随着社會環境的變化,戴口罩轉變為典型場景,人臉識别解決大面積遮擋問題的同時會引入精度的降低。

攻擊問題:面對采用照片、人臉面皮或者3D頭模做的惡意攻擊問題,視覺算法需要具有完整的活體檢測功能,并且具備較高的精度指标。

●人臉識别數據解決方案

①2000人臉多姿态&多表情數據集:2000人每人60張多姿态照片和9張表情照片;不同性别、不同年齡段,不同光照,不同采集環境;人臉姿态、人種、性别和年齡的标簽标注準确率超過96%;可用于人臉識别,表情識别、年齡檢測等任務。

②1000人3D活體檢測數據集:1,000人每人采集120張照片;多表情、人臉多姿态、對抗樣本、多種光照條件、多種場景;标注人物id、人種、性别、年齡、人臉動作、采集場景、光照條件;可用于3D人臉識别、3D活體檢測等任務。

現有訓練集之外,景聯文科技可結合客戶具體業務場景、應用領域特性,設計匹配的可用于算法模型開發、訓練、拓展優化的人臉數據采集标注方案。

2.指紋識别技術

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）4

●技術特點

人的手指末端正面皮膚上凸凹不平産生的紋線,紋線的起點、終點、結合點和分叉點,稱為指紋的細節特征點。指紋識别技術通過分析指紋可測量的特征點,從中抽取特征值,然後進行認證。指紋識别分有光學式、壓敏式、電容式、電感式、熱敏式和超聲波式等。

●應用難點

以智能駕駛汽車應用場景為例,汽車更多的工作在是戶外,每天停在外面風吹日曬,很容易會因為外面的各種因素導緻車子的指紋産生不靈敏或者損壞的現象,而且把指紋解鎖的設備安裝在門把手内,難以保證不會遭到人為的破壞。如果把指紋識别放在傳統汽車的“無鑰匙進入”位置,那指紋信息首先要傳送到“認證控制器”,控制器再把認證信息傳到汽車的IBU模塊,然後汽車的CPU再通過對比決定是否執行開門指令,運算時間會導緻開車門效率大幅降低,讓人覺得指紋識别不僅增加了成本,降低了安全,還制造了很多麻煩。

●指紋識别數據解決方案

①1476人真假指紋采集數據集:1476個id1337080張圖像;假指紋采集材料:新型電容膠、固體膠、橡皮膠、指甲油、粘土、掃描打印、銅粉、新型電容膠等60餘種;真指紋采集環境:幹燥環境、濕潤環境、低溫環境、強光環境、不同角度、不同力度按壓。

現有訓練集之外,景聯文科技可結合客戶具體業務場景、應用領域特性,設計匹配的可用于算法模型開發、訓練、拓展優化的指紋數據采集标注方案。

3.行為識别技術

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）5

●技術特點

通過人體行為識别、高精度三維人臉檢測、目标軌迹跟蹤、高精度微表情捕捉及非接觸式生物特征測量等方式,多維度對目标行為進行檢測,從而保障識别結果的精準度。以智能駕駛場景為例,通過檢測追蹤包括頭部朝向、面部表情、視線方向、手勢及肢體關鍵點等人體視覺特征,分析駕駛員及乘客的身份信息、意圖和行為,技術需要精确檢測出駕乘人員的身份、性别年齡、五官、視線方向、頭部朝向、手勢、肢體關節點等信息以及他們的随身物品。通過對這些關鍵信息的檢測,狀态監測技術可以應用在不同的功能上,比如:駕駛員監控、乘客監控、艙内物品檢測和駕艙人機交互。

●應用難點

行為特征屬于高維時序特征,沒有通用的方法有效提取,單個檢測模型難以覆蓋所有需要監測的行為。要達到多種行為的準确檢測,需要多個達到一定複雜程度的檢測模型,也就需要計算系統有比較高的計算能力。目前缺少有關具體場景的行為視頻數據庫,需要采集、制作、标注針對訓練和測試的數據,數據的建立包含大量标注工作,人工标注的成本高且費時費力。

●行為識别數據解決方案

①500人駕駛員行為采集數據集:多人種、多年齡段、多時間段、多種行為(危險駕駛行為、疲勞駕駛行為、視線偏移行為);采集設備:可見光和紅外雙目攝像頭;白天、傍晚和夜晚;标簽标注準确率95%以上;可用于駕駛員行為分析等任務。

②100人乘客行為識别數據集:多年齡段、多時間段、多種行為(正常行為、暈車行為、乘客困意行為、乘客遺落物品行為);可見光和紅外雙目攝像頭;白天、傍晚、夜晚;标簽标注準确率95%以上;可用于乘客行為分析等任務。

現有訓練集之外,景聯文科技可結合客戶具體業務場景、應用領域特性,設計匹配的可用于算法模型開發、訓練、拓展優化的行為數據采集标注方案。

4.虹膜識别技術

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）6

●技術特點

虹膜識别是基于對人眼虹膜圖像的掃描進行身份辨識,眼睛的虹膜形成由遺傳基因決定,利用虹膜的終身不變性和差異性來實現對身份的甄别。虹膜識别使用紅外攝像技術獲取圖像的豐富細節,非接觸性的特質帶來更高的效率和更優質的體驗。由于一個人的兩隻眼睛的虹膜是不同的,系統掃描一隻眼睛進行身份驗證識别的出錯的概率為百萬分之一,而同時掃描兩隻眼睛的出錯概率更會降至萬億分之一,具有更高的準确率。

●技術難點

虹膜圖像采集不同于其他識别技術,需要使用專業的設備,增加了應用成本。虹膜識别要求在較小的區域範圍内采集到清晰完整的虹膜圖像,攝像頭的視場角一般比較小,同時對遮擋比較敏感,且系統無法在陽光直射下捕捉幹淨的虹膜圖像,光照環境和安裝布置位置對其影響較大。虹膜對用戶交互配合度的要求更高,目前虹膜可支持的采集距離是1米左右,超過了距離或者被識别物體進行以一定速率進行移動時識别度就會大幅下降。

●虹膜識别數據解決方案

景聯文科技可結合客戶具體業務場景、應用領域特性,設計匹配的可用于算法模型開發、訓練、拓展優化的虹膜數據采集标注方案。

5.指靜脈識别技術

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）7

●技術特點

指靜脈識别技術利用手指内的靜脈分布圖像來進行身份辨識,是依據人類手指中流動的血液可吸收特定波長的光線特性,使用特定波長光線對手指進行照射,得到手指靜脈的清晰圖像。指靜脈隐藏在身體内部,被複制或者盜用的機會很小安全等級高,受生理和環境因素的影響小,克服了皮膚幹燥,油污,灰塵,皮膚表面異常等因素适用性強。由于脫離生命主體的手指無法使用,實現身份标識的唯一性。指靜脈識别技術除了識别速度快,識别精準之外,對算力的要求比指紋高,比人臉低,對後端的處理器性能要求依賴性不強。

●應用難點

受算法限制,指靜脈識别技術對手指采集區域有嚴格要求,如果采集和認證時的手指區域偏差較大,會在一定程度上影響識别的準确率,甚至是不能互認識。目前指靜脈識别産品采用光學成像形式采集血管圖像,因為設備尺寸相較于半導體指紋模組偏大,而且需要手指接觸使用,冬天存在凍手影響體驗的問題。

●指靜脈識别數據解決方案

景聯文科技可結合客戶具體業務場景、應用領域特性,制定匹配可用于算法模型開發、訓練、拓展優化的指靜脈數據采集标注方案。

七.景聯文科技為生物識别技術提供一站式數據解決方案

景聯文科技成立于2012年,行業領先的AI基礎數據服務企業,全國信标委生物特征識别分委會移動設備工作組成員單位,全國信标委人工智能分委會成員單位。在指紋技術領域,持有多項自主知識産權專利及軟件著作權,曾3次參與國家标準制定。《互聯網周刊》&eNet研究院、德本咨詢聯合發布《2021數據标注公司排行》,景聯文科技憑借完備的标注管理流程和豐富的項目實操經驗,榮登2021年數據标注公司TOP15。

現有數據集

自有數據庫包含多種類型的數據産品。

2000人臉多姿态&多表情數據集;

1000人3D活體檢測數據集;

1476人真假指紋采集數據集;

500人駕駛員行為采集數據集;

100人乘客行為識别數據集;

500人唇語視頻數據集;

800小時噪音環境口音普通話手機采集語音數據集;

......

人工智能人臉識别技術摘要（你需要的人工智能生物識别AI數據集全在這裡）8

項目經驗

景聯文科技目前已在智能安防、智能駕駛、智能家居、虛拟客服、智慧金融,新零售,智慧校園等數十個場景為客戶提供一站式數據解決方案,擁有豐富的場景搭建能力和數據采集标注經驗。

在全國範圍内擁有5個标注基地,220名全職人工智能訓練師,文本、語音、圖像、視頻現有數據庫超300TB;并于2020年上線了自有标注平台,涵蓋了絕大多數主流标注工具,支持語義分割、拉框标注、多邊形标注、關鍵點标注、3D點雲、2D3D融合标注、圖片分類、聲紋識别、ASR轉寫、韻律标注、NLP、文本分類、OCR轉寫、情緒判斷等多種标注業務。

截至2021年,景聯文科技已與阿裡巴巴、華為、vivo、美團、字節跳動、滴滴、陌陌、海康威視、大華、宇視、同濟大學、中國人民大學、工信部中國電子技術标準化研究院、公安部一所等60 企業、機構達成深入合作。

數據安全管理

成立景聯文數據信息與隐私保護工作小組,定期組織項目經理,質檢員,标注員進行數據安全和隐私保密的培訓考試,制定完善信息隐私保護方案,所采集生物特征相關數據集均獲得被采集者書面或電子授權;項目人員辦公場所具備獨立門禁系統、安防系統和參訪制度,使用WorkWin管理軟件監控設備,标注所用電腦安裝USB管控軟件,可按客戶要求禁用指定軟件。保證采集數據合規,保護客戶數據隐私。

未來,景聯文科技也将不斷升級和完善多場景AI數據解決方案,為生物識别技術的發展貢獻力量,為人工智能企業提供更優質的數據集産品和數據采集标注服務。