Impactul Diversității asupra datelor de formare

Date diverse de instruire AI pentru incluziune și eliminarea părtinirii

Inteligența artificială și Big Data au potențialul de a găsi soluții la probleme globale, acordând prioritate problemelor locale și transformând lumea în multe moduri profunde. Inteligența artificială aduce soluții tuturor – și în toate situațiile, de la casă la locul de muncă. Calculatoare AI, cu Invatare mecanica antrenament, poate simula un comportament inteligent și conversații într-un mod automat, dar personalizat.

Cu toate acestea, AI se confruntă cu o problemă de incluziune și este adesea părtinitoare. Din fericire, concentrându-mă pe etica inteligenței artificiale poate introduce noi posibilități în ceea ce privește diversificarea și includerea prin eliminarea părtinirii inconștiente prin diverse date de antrenament.

Importanța diversității în datele de antrenament AI

Diversitatea datelor de antrenament Ai Diversitatea și calitatea datelor de formare sunt legate, deoarece una o afectează pe cealaltă și are un impact asupra rezultatului soluției AI. Succesul soluției AI depinde de date diverse este antrenat pe. Diversitatea datelor împiedică supraadaptarea AI - ceea ce înseamnă că modelul funcționează sau învață doar din datele folosite pentru antrenament. În cazul supraajustării, modelul AI nu poate oferi rezultate atunci când este testat pe date neutilizate în antrenament.

Starea actuală a instruirii AI de date

Inegalitatea sau lipsa diversității în date ar duce la soluții AI inechitabile, lipsite de etică și neincluzive, care ar putea adânci discriminarea. Dar cum și de ce diversitatea datelor are legătură cu soluțiile AI?

Reprezentarea inegală a tuturor claselor duce la identificarea greșită a fețelor – un caz important este Google Foto, care a clasificat un cuplu de negru drept „gorile”. Și Meta îi solicită unui utilizator care vizionează un videoclip cu bărbați de culoare dacă utilizatorul ar dori să „continue să vizioneze videoclipuri cu primate”.

De exemplu, clasificarea inexactă sau incorectă a minorităților etnice sau rasiale, în special în chatbot, ar putea duce la prejudicii în sistemele de instruire AI. Conform raportului din 2019 privind Sisteme de discriminare – gen, rasă, putere în AI, peste 80% dintre profesorii de IA sunt bărbați; femeile cercetătoare AI de pe FB reprezintă doar 15% și 10% pe Google.

Impactul diverselor date de antrenament asupra performanței AI

Impactul diversității asupra datelor de formare Lăsarea anumitor grupuri și comunități din reprezentarea datelor poate duce la algoritmi distorsionați.

Prejudecățile de date este adesea introdusă accidental în sistemele de date - prin sub-eșantionarea anumitor rase sau grupuri. Atunci când sistemele de recunoaștere facială sunt antrenate pe diferite fețe, acesta ajută modelul să identifice caracteristici specifice, cum ar fi poziția organelor faciale și variațiile de culoare.

Un alt rezultat al unei frecvențe dezechilibrate a etichetelor este că sistemul ar putea considera o minoritate ca o anomalie atunci când este presurizat pentru a produce o ieșire într-un timp scurt.

Să discutăm astăzi despre cerințele tale privind datele de instruire AI.

Atingerea diversității în datele de instruire AI

Pe de altă parte, generarea unui set de date divers este, de asemenea, o provocare. Lipsa totală de date privind anumite clase ar putea duce la subreprezentare. Poate fi atenuat prin diversificarea echipelor de dezvoltatori AI în ceea ce privește abilitățile, etnia, rasa, genul, disciplină și multe altele. Mai mult, modalitatea ideală de a aborda problemele legate de diversitatea datelor în IA este să le confrunți din primă fază, în loc să încerci să remediezi ceea ce s-a făcut – infuzând diversitatea în etapa de colectare și curatare a datelor.

Indiferent de hype-ul din jurul AI, depinde în continuare de datele colectate, selectate și antrenate de oameni. Prejudecățile înnăscute la oameni se vor reflecta în datele colectate de ei, iar această părtinire inconștientă se strecoară și în modelele ML. 

Pași pentru colectarea și conservarea diverselor date de instruire

Includerea diversității datelor de formare

Diversitatea datelor se poate realiza prin:

  • Adăugați cu atenție mai multe date din clasele subreprezentate și expuneți modelele dvs. la puncte de date variate. 
  • Prin colectarea datelor din diferite surse de date. 
  • Prin creșterea datelor sau manipularea artificială a seturilor de date pentru a crește/include noi puncte de date distinct diferite de punctele de date originale. 
  • Când angajați candidați pentru procesul de dezvoltare AI, eliminați toate informațiile irelevante pentru job din aplicație. 
  • Îmbunătățirea transparenței și a răspunderii prin îmbunătățirea documentației privind dezvoltarea și evaluarea modelelor. 
  • Introducerea unor reglementări pentru a construi diversitatea și inclusivitatea în IA sisteme de la nivel de bază. Diverse guverne au elaborat linii directoare pentru a asigura diversitatea și a atenua prejudecățile AI care pot oferi rezultate inechitabile. 

[ Citește și: Aflați mai multe despre procesul de colectare a datelor de formare AI ]

Concluzie

În prezent, doar câteva mari companii de tehnologie și centre de învățare sunt implicate exclusiv în dezvoltarea soluțiilor AI. Aceste spații de elită sunt pline de excludere, discriminare și părtinire. Cu toate acestea, acestea sunt spațiile în care IA este dezvoltată, iar logica din spatele acestor sisteme AI avansate este plină de aceeași părtinire, discriminare și excludere suportate de grupurile subreprezentate. 

În timp ce discutăm despre diversitate și nediscriminare, este important să punem la îndoială oamenii de care beneficiază și cei pe care îi dăunează. Ar trebui să ne uităm, de asemenea, la cine dezavantajează – forțând ideea unei persoane „normale”, inteligența artificială ar putea pune „ceilalți” în pericol. 

Discutarea despre diversitatea datelor AI fără a recunoaște relațiile de putere, echitatea și justiția nu va arăta imaginea de ansamblu. Pentru a înțelege pe deplin amploarea diversității în datele de instruire AI și modul în care oamenii și AI pot atenua împreună această criză, contactați inginerii de la Shaip. Avem diverși ingineri AI care pot furniza date dinamice și diverse pentru soluțiile dumneavoastră AI. 

Partajare socială