Segmentare semantică a scenei complete

Cum a realizat Shaip segmentarea semantică la nivel de pixel pe scene stradale complete — etichetând fiecare obiect și suprafață, de la drumuri și cer până la marcaje rutiere și stâlpi fini — construită ca un set de date de nivel de producție pentru condus autonom, orașe inteligente și inteligență artificială de mediu.

Segmentarea semantică a scenei complete

rezumatul proiectului

Întrucât înțelegerea scenei devine fundamentul condusului autonom, al planificării inteligente a orașelor și al monitorizării mediului prin inteligență artificială, clientul avea nevoie de o conductă de segmentare cuprinzătoare, capabilă să eticheteze fiecare pixel din imagine - nu doar casetele de delimitare sau obiectele majore.

Shaip a construit conducta de adnotare la nivel de pixel end-to-end, acoperind instrumentele pentru poligoane și măști semantice, acoperirea cuprinzătoare a claselor, gestionarea limitelor cu precizie de muchie și asigurarea calității pe două niveluri — producând seturi de date pregătite pentru model, pentru înțelegerea completă a scenelor prin inteligență artificială.

Statistici cheie

Precizia pixelilor

99%

Niveluri de asigurare a calității

2 nivele

Acoperire

Fiecare pixel

Set de clase

Cuprinzător

Activități

  • etichetarea fiecare pixel în imagine — nu este permisă nicio regiune neetichetată
  • calc limite neregulate a coronamentelor vegetale, a suprafețelor de apă și a crăpăturilor drumurilor
  • Distingător marcaje rutiere de pe suprafețele drumurilor în condiții uzate sau decolorate
  • separare cer din ceață sau fundaluri înnorate cu precizie
  • Mentine granițe clare de clasă la tranzițiile de la drum la trotuar, de la vegetație la sol, de la apă la sol

Soluţie

Set complet de cursuri

Adnotarea a acoperit un set complet de categorii de scene - suprafețe rutiere, cer, vegetație, sol și teren, corpuri de apă, stâlpi și structuri de semnalizare, marcaje rutiere (linii de bandă, săgeți, treceri de pietoni), vehicule (autoturisme, camioane, autobuze, motociclete, biciclete) și clădiri și structuri artificiale. Fiecare pixel a fost atribuit uneia dintre clasele definite.

Instrumente pentru măști poligonale și semantice

Adnotatorii au folosit instrumente specializate pentru poligoane și pensule pentru măști semantice pentru a gestiona limitele obiectelor curbate, neregulate și dense cu o precizie perfectă la nivel de pixel. Selecția instrumentelor a fost adaptată la complexitatea formei obiectului - măști pentru forme organice, cum ar fi vegetația, poligoane pentru obiecte structurate, cum ar fi vehiculele.

Instrucțiuni de precizie a muchiilor

Au fost respectate definiții stricte ale claselor și instrucțiuni de precizie a marginilor pentru a asigura limite clare între clasele adiacente, în special în zonele de tranziție, cum ar fi limitele drum-trotuar, vegetație-sol și apă-sol. Această precizie este ceea ce face ca modelele de detectare a zonelor circulabile în aval și a obstacolelor să fie fiabile.

Manipularea structurii fine

Structurile fine precum stâlpii, semnele de circulație și indicatoarele rutiere ocupă doar câțiva pixeli în imaginile cu unghi larg, dar sunt esențiale pentru inteligența artificială din aval. Adnotatorii au urmat instrucțiuni dedicate pentru a captura aceste detalii fine fără a sacrifica precizia limitelor scenei.

QA pe două niveluri și precizie de 99% a pixelilor

Fiecare imagine segmentată a trecut printr-un proces riguros de asigurare a calității pe două niveluri, cu verificări ale consistenței între adnotatori, revizuiri ale preciziei marginilor și validare a limitelor de clasă. O precizie minimă la nivel de pixel de 99% a acoperit fiecare set de date înainte de livrare.

Domeniul de aplicare al proiectului

Tipul setului de date Acoperire Instrumente de adnotare Set de clase QA Acuratețe
Segmentarea semantică a scenei complete Fiecare pixel etichetat Poligoane + măști semantice Clase de scenă cuprinzătoare Controlul calității pe 2 niveluri 99% la nivel de pixel

Rezultate

  • Înființat a conductă de înțelegere a scenei la nivel de pixel pentru AV și inteligența artificială a orașelor inteligente
  • standardizat acoperire completă a clasei cu fiecare pixel etichetat
  • Livrat tranziții curate la limitele clasei în zone complexe
  • Menținut Precizie de 99% la nivel de pixel prin intermediul QA pe două niveluri
  • A activat clientul zonă circulabilă, planificare urbană, monitorizare a mediului și urmărire a construcțiilor AI

Per total, Shaip a contribuit la transformarea unei cerințe de înțelegere a scenelor la nivel de pixel într-o conductă de segmentare structurată, pregătită pentru producție - una capabilă să susțină conducerea autonomă, analiza orașelor inteligente, monitorizarea mediului și progresul șantierelor de construcții prin inteligență artificială, cu precizie de etichetare completă a scenelor.

Pictogramă citat

Shaip ne-a ajutat să transformăm calitatea audio subiectivă într-un program de îmbunătățire măsurabil. Cadrul lor de evaluare ne-a oferit semnale clare despre ce trebuie să remediem, unde să îmbunătățim și cum să ne apropiem de producție cu încredere.

— Lider de produse de vorbire cu inteligență artificială

★ ★ ★ ★ ★
Pictogramă citat