Mintea umană a rămas inexplicabilă și misterioasă de mult, mult timp. Și se pare că oamenii de știință au recunoscut un nou candidat la această listă - Inteligența artificială (AI). La început, înțelegerea minții unei IA sună destul de oximoronic. Cu toate acestea, pe măsură ce IA devine treptat mai sensibilă și evoluează mai aproape de a imita oamenii și emoțiile lor, asistăm la fenomene care sunt înnăscute oamenilor și animalelor - halucinații.
Da, se pare că tocmai călătoria în care se aventurează mintea atunci când este abandonată într-un deșert, aruncată pe o insulă sau închisă singură într-o cameră fără ferestre și uși este experimentată și de mașini. halucinație AI este real, iar experții și entuziaștii de tehnologie au înregistrat multiple observații și inferențe.
În articolul de astăzi, vom explora acest aspect misterios, dar intrigant al Modele de limbaj mari (LLM) și aflați fapte ciudate despre halucinațiile AI.
Ce este halucinația AI?
În lumea AI, halucinațiile nu se referă vag la modele, culori, forme sau oameni pe care mintea îi poate vizualiza cu luciditate. În schimb, halucinația se referă la fapte și răspunsuri incorecte, inadecvate sau chiar înșelătoare Instrumente AI generative veni cu îndemnuri.
De exemplu, imaginați-vă că întrebați un model AI ce este un telescop spațial Hubble și acesta începe să răspundă cu un răspuns precum: „Camera IMAX este o imagine în mișcare specializată, de înaltă rezoluție...”.
Acest răspuns este irelevant. Dar, mai important, de ce a generat modelul un răspuns care este tangențial diferit de promptul prezentat? Experții cred că halucinațiile ar putea proveni din mai mulți factori, cum ar fi:
- Calitatea slabă a datelor de antrenament AI
- Modele AI prea încrezătoare
- Complexitatea programelor de procesare a limbajului natural (NLP).
- Erori de codificare și decodare
- Atacurile adverse sau hackurile modelelor AI
- Divergența sursă-referință
- Prejudecăți de intrare sau ambiguitate de intrare și multe altele
Halucinația AI este extrem de periculoasă și intensitatea sa crește doar odată cu specificarea sporită a aplicării sale.
De exemplu, un instrument GenAI halucinant poate cauza pierderi de reputație pentru o întreprindere care îl implementează. Cu toate acestea, atunci când un model AI similar este implementat într-un sector precum asistența medicală, schimbă ecuația dintre viață și moarte. Vizualizați acest lucru, dacă un model AI halucinează și generează un răspuns la analiza datelor din rapoartele imagistice medicale ale unui pacient, poate raporta din neatenție o tumoare benignă ca malignă, ceea ce duce la o abatere a cursului diagnosticului și tratamentului individului.
Înțelegerea exemplelor de halucinații AI
Halucinațiile IA sunt de diferite tipuri. Să le înțelegem pe unele dintre cele mai proeminente.
Răspuns incorect al informațiilor
- Răspunsuri fals pozitive, cum ar fi semnalarea gramaticii corecte în text ca fiind incorectă
- Răspunsuri fals negative, cum ar fi trecerea cu vederea erorilor evidente și trecerea lor drept autentice
- Invenția de fapte inexistente
- Aprovizionarea incorectă sau manipularea citatelor
- Exces de încredere în a răspunde cu răspunsuri incorecte. Exemplu: Cine a cântat Here Comes Sun? Metallica.
- Amestecarea de concepte, nume, locuri sau incidente
- Răspunsuri ciudate sau înfricoșătoare, cum ar fi popularul râs autonom demonic al Alexa și multe altele
Prevenirea halucinațiilor AI
Dezinformare generată de AI de orice tip poate fi detectat și reparat. Aceasta este specialitatea lucrului cu AI. Noi am inventat asta și putem rezolva asta. Iată câteva modalități prin care putem face acest lucru.
Limitarea răspunsurilor
Ei spun că nu contează câte limbi vorbim. Trebuie să știm când să nu mai vorbim în toate. Acest lucru se aplică și modelelor AI și răspunsurilor acestora. În acest context, putem restricționa capacitatea unui model de a genera răspunsuri la un anumit volum și de a reduce șansele ca acesta să aibă rezultate bizare. Aceasta se numește Regularizare și implică, de asemenea, penalizarea modelelor AI pentru obținerea unor rezultate extreme și extinse la solicitări.
Surse relevante și etanșe pentru a cita și a extrage răspunsuri
Atunci când antrenăm un model AI, putem, de asemenea, să limităm sursele la care se poate referi un model și din care poate extrage informații doar la cele legitime și credibile. De exemplu, modelele de IA din domeniul sănătății, cum ar fi exemplul pe care l-am discutat mai devreme, se pot referi numai la surse care sunt credibile în informații încărcate cu imagini medicale și tehnologii de imagistică. Acest lucru împiedică mașinile să găsească și să corelaze modele din surse bipolare și să genereze un răspuns.
Definirea scopului unui model AI
Modelele AI învață rapid și trebuie doar să li se spună exact ce ar trebui să facă. Prin definirea cu precizie a scopului modelelor, putem antrena modelele pentru a-și înțelege propriile capacități și limitări. Acest lucru le va permite să își valideze în mod autonom răspunsurile prin alinierea răspunsurilor generate la solicitările utilizatorului și scopul lor de a oferi rezultate curate.
Supravegherea umană în IA
Sistemele de instruire AI sunt la fel de esențiale precum predarea unui copil să înoate sau să meargă cu bicicleta pentru prima dată. Necesită supraveghere adultă, moderare, intervenție și ținere de mână. Majoritatea halucinațiilor AI apar din cauza neglijenței umane în diferite stadii de dezvoltare a AI. Prin desfășurarea experților potriviți și asigurarea unui flux de lucru uman în buclă pentru a valida și analiza răspunsurile AI, pot fi obținute rezultate de calitate. În plus, modelele pot fi rafinate și mai mult pentru acuratețe și precizie.
Shaip și rolul nostru în prevenirea halucinațiilor AI
Una dintre celelalte cele mai mari surse de halucinații sunt datele slabe de antrenament AI. Ceea ce hrănești este ceea ce primești. De aceea, Shaip ia măsuri proactive pentru a asigura furnizarea de date de cea mai înaltă calitate pentru dvs antrenament AI generativ nevoile mai complexe ale clienților.
Protocoalele noastre stricte de asigurare a calității și seturile de date din surse etice sunt ideale pentru viziunile tale AI în ceea ce privește furnizarea de rezultate curate. Deși erorile tehnice pot fi rezolvate, este vital ca preocupările legate de calitatea datelor de antrenament să fie abordate la nivelurile lor de bază pentru a preveni reelaborarea dezvoltării modelului de la zero. Acesta este motivul pentru care dvs AI și LLM faza de instruire ar trebui să înceapă cu seturile de date de la Shaip.