Computer Vision

Cele mai căutate 22 de seturi de date open-source pentru computer Vision

Un algoritm AI este la fel de bun ca și datele pe care le furnizați.

Nu este nici o afirmație îndrăzneață, nici neconvențională. AI ar fi putut părea destul de exagerat în urmă cu câteva decenii, dar inteligența artificială și învățarea automată au parcurs foarte mult de atunci.

Viziunea computerului ajută computerele să înțeleagă și să interpreteze etichetele și imaginile. Când vă antrenați computerul folosind tipul potrivit de imagini, acesta poate câștiga capacitatea de a detecta, înțelege și identifica diverse trăsături faciale, detecta boli, conduce vehicule autonome și, de asemenea, poate salva vieți folosind scanarea multidimensională a organelor.

Piața Computer Vision este estimată să ajungă $ 144.46 miliarde până în 2028, de la un modest 7.04 miliarde de dolari în 2020, în creștere cu un CAGR de 45.64% între 2021 și 2028.

Unele dintre cazurile de utilizare ale vederii computerizate sunt:

  • Imagistica medicala
  • Vehicul autonom
  • Recunoașterea feței și a obiectelor
  • Identificarea defectelor
  • Detectarea scenelor

set de date de imagine vă hrăniți și pregătiți sarcinile de învățare automată și de viziune pe computer sunt cruciale pentru succesul proiectului dvs. de inteligență artificială. Un set de date de calitate este destul de greu de obținut. În funcție de complexitatea proiectului dvs., ar putea dura între câteva zile și câteva săptămâni pentru a obține seturi de date fiabile și relevante pentru scopuri de viziune computerizată.

Aici, vă oferim o gamă (clasificată pentru ușurința dvs.) de seturi de date open-source pe care le puteți utiliza imediat.

Listă cuprinzătoare de seturi de date de computer Vision

General:

  1. IMAGEnet (Link)

    ImageNet este un set de date utilizat pe scară largă și vine cu 1.2 milioane de imagini uimitoare clasificate în 1000 de categorii. Acest set de date este organizat conform ierarhiei WorldNet și clasificat în trei părți - datele de antrenament, etichetele imaginilor și datele de validare.

  2. Cinetica 700 (Link)

    Kinetics 700 este un set de date uriaș de înaltă calitate, cu peste 650,000 de clipuri din 700 de clase diferite de acțiune umană. Fiecare dintre acțiunile colective are aproximativ 700 de videoclipuri. Clipurile din setul de date au interacțiuni om-obiect și om-om, care se dovedesc a fi destul de utile atunci când recunoaștem acțiunile umane în videoclipuri.

  3. CIFAR-10 (Link)

    CIFAR 10 este unul dintre cele mai mari seturi de date computerizate cu 60000 de imagini color 32 x 32 reprezentând zece clase diferite. Fiecare clasă are aproximativ 6000 de imagini folosite pentru a antrena algoritmi de viziune computerizată și învățarea automată.

Recunoastere faciala:

Recunoastere faciala

  1. Fețe etichetate în sălbăticie (Link)

    Labeled Faced in the Wild este un set uriaș de date care conține peste 13,230 de imagini cu aproape 5,750 de persoane detectate de pe internet. Acest set de date de fețe este conceput pentru a facilita studierea detectării neconstrânse a feței.

  2. CASIA WebFace (Link)

    CASIA Web face este un set de date bine conceput care ajută la învățarea automată și la cercetarea științifică privind recunoașterea facială neconstrânsă. Cu peste 494,000 de imagini cu aproape 10,000 de identități reale, este ideal pentru identificarea feței și sarcinile de verificare.

  3. Setul de date UMD Faces (Link)

    UMD se confruntă cu un set de date bine adnotat care conține două părți – imagini statice și cadre video. Setul de date are peste 367,800 de adnotări faciale și 3.7 milioane de cadre video adnotate ale subiecților.

Scris de mana recunoscut:

  1. Baza de date MNIST (Link)

    MNIST este o bază de date care conține mostre de cifre scrise de mână de la 0 la 9 și are 60,000 și 10,000 de imagini de antrenament și testare. Lansat în 1999, MNIST facilitează testarea sistemelor de procesare a imaginilor în Deep Learning.

  2. Set de date de caractere artificiale (Link)

    Setul de date Artificial Characters este, după cum sugerează și numele, date generate artificial care descriu structura limbii engleze în zece litere mari. Vine cu peste 6000 de imagini.

Să discutăm astăzi despre cerințele tale privind datele de instruire AI.

Detectarea obiectelor:

  1. MS COCO (Link)

    MS COCO sau Common Objects in Context este un set de date de detectare și subtitrare a obiectelor.

    Are mai mult de 328,000 de imagini cu detectarea punctelor cheie, detectarea mai multor obiecte, subtitrări și adnotări pentru mască de segmentare. Vine cu 80 de categorii de obiecte și cinci legende pe imagine.

  2. LSUN(Link)

    LSUN, prescurtare de la Large-Scale Scene Understanding, are mai mult de un milion de imagini etichetate în 20 de obiecte și 10 categorii de scene. Unele categorii au aproape 300,000 de imagini, cu 300 de imagini special pentru validare și 1000 de imagini pentru datele de testare.

  3. Obiecte de acasă(Link)

    Setul de date Home Objects conține imagini adnotate cu obiecte aleatorii din jurul casei - bucătărie, sufragerie și baie. Acest set de date are, de asemenea, câteva videoclipuri adnotate și 398 de fotografii neadnotate concepute pentru testare.

Automotive:

  1. Set de date peisaj urban (Link)

    Cityscape este setul de date la care trebuie să mergeți atunci când căutați diferite secvențe video înregistrate din scenele de stradă ale mai multor citate. Aceste imagini au fost surprinse pe o perioadă lungă de timp și în diferite condiții de vreme și lumină. Adnotările sunt pentru 30 de clase de imagini împărțite în opt categorii diferite.

  2. Barkley Deep Drive (Link)

    Barkley DeepDrive este conceput special pentru antrenamentul cu vehicule autonome și are peste 100 de mii de secvențe video adnotate. Este una dintre cele mai utile date de antrenament pentru vehiculele autonome, în funcție de schimbarea condițiilor de drum și de conducere.

  3. Mapilar (Link)

    Mapillary are peste 750 de milioane de scene de stradă și semne de circulație în întreaga lume, ceea ce este foarte util în antrenarea modelelor de percepție vizuală în învățarea automată și algoritmi AI. Vă permite să dezvoltați vehicule autonome care să răspundă diferitelor condiții de iluminare și vreme și puncte de vedere.

Imagistica medicala:

  1. Set de date deschise de cercetare Covid-19 (Link)

    Acest set de date original are aproximativ 6500 de segmente pulmonare poligonale de pixeli despre radiografiile toracice AP/PA. În plus, sunt disponibile 517 imagini cu raze X ale pacientului cu Covid-19, cu etichete care conțin numele, locația, detaliile de admitere, rezultatul și multe altele.

  2. Baza de date NIH cu 100,000 de raze X toracice (Link)

    Baza de date NIH este una dintre cele mai extinse seturi de date disponibile public, care conține 100,000 de imagini cu raze X toracice și date conexe utile pentru comunitatea științifică și de cercetare. Are chiar și imagini ale pacienților cu afecțiuni pulmonare avansate.

  3. Atlas de patologie digitală (Link)

    Atlas of Digital Pathology oferă mai multe imagini de plasture histopatologice, peste 17,000 în total, din aproape 100 de diapozitive adnotate ale diferitelor organe. Acest set de date este util în dezvoltarea software-ului de viziune computerizată și de recunoaștere a modelelor.

Recunoașterea scenei:

Recunoașterea scenei

  1. Recunoașterea scenei de interior (Link)

    Indoor Scene Recognition este un set de date foarte clasificat, cu aproape 15620 de imagini cu obiecte și peisaje interioare, care pot fi utilizate în învățarea automată și instruirea datelor. Vine cu peste 65 de categorii, iar fiecare categorie are minim 100 de imagini.

  2. xView (Link)

    Fiind unul dintre cele mai cunoscute seturi de date disponibile public, xView conține tone de imagini aeriene adnotate din diverse scene complexe și mari. Având aproximativ 60 de clase și mai mult de un milion de instanțe de obiecte, scopul acestui set de date este de a oferi o mai bună asistență în caz de dezastre folosind imagini din satelit.

  3. Locuri (Link)

    Places, un set de date oferit de MIT, are peste 1.8 milioane de imagini din 365 de categorii diferite de scene. Există aproximativ 50 de imagini în fiecare dintre aceste categorii pentru validare și 900 de imagini pentru testare. Este posibil să învățați caracteristici de scenă profundă pentru a stabili recunoașterea scenei sau sarcinile de recunoaștere vizuală.

Divertisment:

  1. Setul de date IMDB WIKI (Link)

    IMDB – Wiki este una dintre cele mai populare baze de date publice de chipuri etichetate adecvat cu vârsta, sexul și nume. Are și aproximativ 20 de mii de fețe de vedete și 62 de mii de la Wikipedia.

  2. Chipuri de vedete (Link)

    Celeb Faces este o bază de date la scară largă cu 200,000 de imagini adnotate ale celebrităților. Imaginile vin cu zgomot de fundal și variații de poziție, ceea ce le face valoroase pentru antrenamentul seturi de teste în sarcini de viziune computerizată. Este extrem de benefic pentru obținerea unei precizii mai mari în recunoașterea facială, editare, localizarea părților faciale și multe altele.

Acum că aveți o listă masivă de seturi de date de imagini open-source pentru a vă alimenta mașinile de inteligență artificială. Rezultatul modelelor dvs. de inteligență artificială și de învățare automată depinde în primul rând de calitatea seturilor de date pe care le alimentați și pe care le instruiți. Dacă doriți ca modelul dvs. de inteligență artificială să genereze predicții precise, are nevoie de seturi de date de calitate, care sunt agregate, etichetate și etichetate la perfecțiune. Pentru a amplifica succesul sistemului dvs. de viziune computerizată, trebuie să utilizați baze de date cu imagini de calitate relevante pentru viziunea proiectului dumneavoastră. Dacă căutați mai multe astfel de seturi de date Click aici

Partajare socială

Ați putea dori, de asemenea