Definiție
Segmentarea semantică este sarcina de viziune computerizată de clasificare a fiecărui pixel dintr-o imagine într-o categorie, cum ar fi drum, clădire sau pieton.
Scop
Scopul este de a oferi o înțelegere detaliată a scenei pentru aplicațiile de inteligență artificială în condus autonom, imagistică medicală și robotică.
Importanță
- Esențial pentru percepția la nivel de pixel în sistemele critice pentru siguranță.
- Permite limite precise ale obiectelor în comparație cu casetele de încadrare.
- Necesită seturi mari de date adnotate.
- Intensiv din punct de vedere computațional la rezoluții înalte.
Cum funcționează
- Colectați și etichetați imagini adnotate la nivel de pixel.
- Antrenează modele de deep learning precum rețele complet convoluționale.
- Imaginea de intrare este procesată în predicții la nivel de pixel.
- Masca de ieșire atribuie fiecărui pixel unei clase.
- Evaluați cu metrici precum Intersecție peste Uniune (IoU).
Exemple (din lumea reală)
- Set de date despre peisaje urbane: segmentare semantică pentru scene urbane.
- Tesla Autopilot: segmentare la nivel de pixel pentru navigație rutieră.
- Imagistică medicală: segmentarea tumorilor în scanările RMN.
Referințe/Lecturi suplimentare
- Long și colab. „Rețele complet convoluționale pentru segmentare semantică”. CVPR 2015.
- Set de date cu peisaje urbane.
- Tranzacții IEEE privind imagistica medicală.