Adnotare Punct Cheie Corpul Uman
Shaip a adnotat 150,000 de cadre de date de imagine și video cu o schemă completă a corpului cu 36 de puncte cheie, combinând repere faciale (cap, ochi, urechi, nas, bărbie) cu articulații scheletice (umeri, coate, încheieturi, șolduri, genunchi, glezne) - pentru a alimenta estimarea poziției, analiza mișcării, urmărirea fitnessului și utilizarea inteligenței artificiale pentru mișcarea în domeniul sănătății.
rezumatul proiectului
Pe măsură ce estimarea poziției și inteligența artificială a mișcării umane intră în implementarea în producție, clientul avea nevoie de un cadru de adnotare scalabil pentru a eticheta 150,000 de cadre de date de imagine și video cu o acoperire precisă din punct de vedere anatomic a punctelor cheie ale întregului corp în diverse condiții reale.
Shaip a construit fluxul complet de adnotări, acoperind plasarea punctelor cheie, gestionarea pozițiilor în unghiuri multiple, gestionarea ocluziilor și asigurarea calității structurată — oferind suport pentru livrarea schemelor corporale în 36 de puncte și producând seturi de date pregătite pentru model, cu un randament zilnic constant.
Stare cheie
Cadre adnotate
150,000
Puncte cheie / Corp
36
Randament zilnic
Rame 30
Platformă
CVAT
Activități
- Scalare de la fluxuri de lucru controlate cu eșantioane la Rame 150,000 adnotării scheletului complet al corpului
- Mentine precizie anatomică în diverse poziții, unghiuri de vizualizare și condiții de iluminare
- Manipularea ocluzie parțială și subiecte care se suprapun fără a compromite acuratețea punctelor cheie
- Coordonarea reper facial + schelet corporal plasarea pe o singură schemă de 36 de puncte
- Susținerea a 30 de cadre pe zi per anotator evaluarea performanței în cadrul întregii echipe
Soluţie
Strategia de adnotare
Shaip a conceput o schemă corporală cu 36 de puncte cheie care acoperă întreaga acoperire anatomică - repere faciale (cap, ochi, urechi, nas, bărbie) combinate cu articulațiile scheletice de pe umeri, brațe, trunchi, șolduri și picioare. Platforma CVAT a fost configurată cu această schemă și implementată în întreaga echipă pentru o etichetare consistentă.
Manipularea Pozelor și a Diversității
Setul de date a acoperit în mod deliberat subiecte diverse, în diferite poziții, unghiuri de vizualizare, condiții de iluminare și tipuri de îmbrăcăminte. Adnotatorii au urmat instrucțiuni specifice fiecărei poziții pentru a gestiona pozițiile în picioare, așezat, ghemuit, culcat și pozițiile de mișcare dinamică cu același nivel de precizie a punctelor cheie.
Reguli de ocluzie și cazuri limită
Reguli stricte guvernau gestionarea ocluziilor parțiale - puncte cheie din spatele hainelor, părți ale corpului ascunse de alte membre și subiecți parțial în afara cadrului. Reperele ascunse au fost marcate cu stegulețe de vizibilitate, în loc să fie aproximate, păstrând integritatea setului de date pentru modelele ulterioare de estimare a poziției.
Benchmark de randament și productivitate
Echipa a menținut un standard de 30 de cadre adnotate aprobate per anotator pe zi, pe parcursul unei ture de 8.5 ore. Acest standard a fost calibrat în funcție de obiectivele de precizie, asigurându-se că randamentul nu compromite calitatea.
Flux de lucru pentru asigurarea calității
Fiecare cadru adnotat a trecut printr-o revizuire structurată a asigurării calității, care a acoperit acuratețea plasării punctelor cheie, corectitudinea semnalizatorului de vizibilitate și consecvența cu schema de 36 de puncte. Cadrele respinse au fost returnate pentru corectare, cu feedback la nivel de adnotator, pentru a stimula îmbunătățirea continuă.
Domeniul de aplicare al proiectului
| Tipul setului de date | Volum | Puncte cheie | Platformă | tranzitată | Companiei |
|---|---|---|---|---|---|
| Schelet uman + adnotare punct cheie | Rame 150,000 | 36 per figură umană | CVAT | 30 de cadre/zi/anotator | Pe mai multe luni |
Rezultate
- Înființat a cadru scalabil de adnotare cu 36 de puncte cheie pregătit pentru antrenamentul de producție pentru estimarea pozițiilor
- standardizat plasarea reperelor anatomice în regiunile faciale și scheletice
- Menținut Randamentul adnotatorului de 30 de cadre pe zi fără a compromite precizia
- Livrat a set de date divers, cu condiții multiple care acoperă poziții, iluminare, unghiuri și tipuri de îmbrăcăminte
- A activat clientul estimarea poziției, analiza mișcării, urmărirea stării de fitness și inteligența artificială a mișcării în domeniul sănătății foaie de parcurs
Per total, Shaip a contribuit la transformarea unei cerințe de adnotare a punctelor cheie de 150,000 de cadre într-un flux structurat, pregătit pentru producție - unul capabil să suporte aplicațiile de inteligență artificială pentru pozițiile umane, urmărirea fitness-ului, diagnosticarea mișcării și aplicațiile de mișcare în domeniul sănătății, cu o precizie și o scalabilitate constante.
Shaip a livrat structura noastră principală de adnotare a punctelor cheie cu precizia de care aveau nevoie modelele noastre de estimare a pozițiilor. Execuția schemei lor de 36 de puncte, gestionarea ocluziilor și randamentul zilnic constant s-au tradus direct într-o performanță mai bună a modelului.
— Director, Inginerie Viziune Artificială