Un studiu de caz asupra modelului de recunoaștere facială
Set de date video anti-spoofing pentru modele AI de detectare a fraudei
Descoperiți cum Shaip a livrat 25,000 de seturi de date video anti-spoofing de înaltă calitate, cu scenarii de atac reale și reluare pentru a antrena modele AI pentru detectarea fraudelor.
rezumatul proiectului
Shaip a colaborat cu o companie lider de securitate AI pentru a oferi un set de date video anti-spoofing de înaltă calitate, disponibil la raft, conceput pentru a îmbunătăți instruirea modelului AI pentru detectarea fraudelor. Setul de date a inclus 25,000 de videoclipuri care surprind atât scenarii de atac reale, cât și scenarii de reluare, asigurând date solide de antrenament pentru modelele anti-spoofing.
Fiecare din Participanții la 12,500 a contribuit cu două videoclipuri – unul real și unul reluare atac – înregistrat la Rezoluție 720p sau mai mare cu o rată de cadre de 26 FPS și mai sus.
Scopul proiectului a fost să livreze seturi de date autentice și diverse care ar permite modelelor AI să facă distincția eficientă între videoclipurile biometrice reale și falsificate, reducând astfel riscurile de fraudă în sistemele de autentificare biometrică.

Statistici cheie
25,000 total videoclipuri (12,500 videoclipuri reale, 12,500 redare videoclipuri cu atacuri)
12,500 unic
participanţi
5 grupuri etnice
reprezentate în setul de date
Livrare în etape: 4 loturi de 6,250 videoclipuri fiecare
Atributele metadatelor: 12 parametri cheie pentru o utilizare îmbunătățită a setului de date
Domeniul de aplicare al setului de date biometrice anti-spoofing
Curatarea setului de date: Proiectul sa concentrat pe furnizarea de seturi de date video anti-spoofing de înaltă calitate, constând din videoclipuri de atac reale și reluare. Aspectele cheie au inclus:
- Participanții la 12,500 contribuind câte două videoclipuri (1 real, 1 falsificat).
- Diversitate în dispozitivele de înregistrare pentru a spori adaptabilitatea modelului.
- Reprezentare etnică echilibrată pentru a asigura inclusivitatea setului de date.
Colectarea metadatelor: Fiecare videoclip a fost însoțit de 12 atribute de metadate pentru a îmbunătăți gradul de utilizare al setului de date.
Provocări de colectare a datelor video
Menținerea unei distribuții echilibrate a datelor în funcție de etnie, în timp ce aprovizionați videoclipuri de înaltă calitate.
Asigurarea faptului că fiecare participant contribuie cu un videoclip de atac real și unul reluat pentru a menține integritatea setului de date.
Respectarea regulilor stricte pentru FPS (≥ 26), rezoluție (≥ 720p) și acuratețea marcajului de timp (+/- 0.5 ms).
Cum am rezolvat-o
Shaip a furnizat un set de date structurat și de înaltă calitate pentru a îndeplini cerințele proiectului. Soluția a inclus:
Curatarea setului de date și controlul calității
- 25,000 video adunate peste 4 faze pentru a asigura un flux de date constant și structurat, evitând blocajele.
- Proces de validare riguros pentru a asigura conformitatea cu FPS, rezoluție și acuratețea metadatelor. Fiecare videoclip a fost supus mai multor verificări de calitate înainte de acceptarea finală.
- Etichetarea cuprinzătoare a metadatelor cu 12 atribute:
- ID/Nume fișier
- Tip de atac (real/reluare)
- ID de persoană
- Rezoluție video
- Durata videoclipului
- Etnia subiectului
- Genul subiectului
- Indiferent dacă videoclipul este original sau falsificat
- Numele/Modelul dispozitivului
- Persoana care vorbeste sau nu
- Ora de începere a marcajului de timp
- Ora de încheiere a marcajului de timp
- Distribuție echilibrată a grupurilor etnice: Setul de date a fost îngrijit cu meticulozitate pentru a menține o reprezentare etnică echilibrată. Distribuția include populațiile hispanice (33%), din Asia de Sud (21%), caucaziene (20%), africane (15%) și din Asia de Est și Orientul Mijlociu (fiecare cuprinzând până la 6%).
- Fără intrări duplicat pentru a menține unicitatea setului de date și a preveni prejudecățile în instruirea AI.
- Selecția participanților diversă din punct de vedere etnic pentru a crea un set de date care să reflecte variațiile utilizatorilor din lumea reală, îmbunătățind adaptabilitatea și corectitudinea modelului AI.
- Variația dispozitivului de înregistrare a inclus mai multe modele de smartphone, camere foto și condiții de iluminare pentru a spori robustețea modelului față de diferite setări de mediu.
Rezultat
Setul de date video anti-spoofing de înaltă calitate și divers oferit de Shaip a permis clientului să antreneze modele AI pentru a diferenția cu precizie între videoclipurile reale și cele falsificate în diferite scenarii de autentificare biometrică. Setul de date a contribuit la:
Performanță îmbunătățită a AI în detectarea atacurilor biometrice frauduloase.
S-a întărit capacitatea modelului de a recunoaște atacurile de reluare din diferite etnii, dispozitive și condiții de mediu.
Setul de date servește drept bază pentru îmbunătățirile și extinderile viitoare ale modelului anti-spoofing.
Setul de date Shaip a jucat un rol esențial în îmbunătățirea modelelor noastre anti-spoofing bazate pe inteligență artificială. Diversitatea, calitatea și metadatele structurate au oferit o bază solidă pentru îmbunătățirea detectării fraudelor în sistemele de autentificare biometrică.