Rezolvarea problemelor a fost una dintre capacitățile înnăscute ale oamenilor. Încă din zilele noastre primitive, când provocările noastre majore din viață nu erau mâncate de o fiară pradă timpurilor contemporane pentru a primi ceva rapid acasă, ne-am combinat creativitatea, raționamentul logic și inteligența pentru a găsi soluții pentru conflicte. .
Acum, pe măsură ce asistăm la geneza sensibililor AI, ne confruntăm cu noi provocări în ceea ce privește capacitățile lor de luare a deciziilor. În timp ce deceniul precedent a vizat celebrarea posibilităților și potențialului modelelor și aplicațiilor AI, acest deceniu este despre a merge mai departe - pentru a pune sub semnul întrebării legitimitatea deciziilor luate de astfel de modele și pentru a deduce raționamentul din spatele lor.
Pe măsură ce inteligența artificială explicabilă (XAI) câștigă mai multă importanță, acesta este momentul să discutăm despre un concept cheie în dezvoltarea modelelor AI pe care le numim Îndemnarea lanțului de gândire. În acest articol, vom decoda pe larg și vom demistifica ceea ce înseamnă acest lucru și termeni simpli.
Ce este stimularea lanțului de gândire?
Atunci când mintea umană este pregătită cu o provocare sau o problemă complexă, ea încearcă în mod natural să o descompună în fragmente de pași secvențiali mai mici. Condusă de logică, mintea stabilește conexiuni și simulează scenarii cauză-efect pentru a stabili cea mai bună soluție posibilă pentru provocare.
Procesul de replicare a acestui lucru într-un model sau sistem AI este Îndemnul lanțului de gândire.
După cum sugerează și numele, un model AI generează o serie sau un lanț de gânduri logice (sau pași) pentru a aborda o interogare sau un conflict. Vizualizați acest lucru ca oferind o instrucțiune pas cu pas cuiva care cere o rută către o destinație.
Aceasta este tehnica predominantă folosită în modelele de raționament OpenAI. Deoarece sunt proiectați să gândească înainte de a genera un răspuns sau un răspuns, au reușit să rezolve examenele competitive susținute de oameni.
[Citește și: Tot ce trebuie să știi despre LLM]
Beneficiile stimulării lanțului de gândire
Orice lucru care este condus de logică aduce un avantaj semnificativ. În mod similar, modelele instruite pe îndemnarea în lanț de gândire oferă nu doar acuratețe și relevanță, ci și o gamă diversă de beneficii, inclusiv:
pachet plus de rezolvare a problemelor capabilități, în care importanța lor este critică în domenii precum sănătatea și finanțele. LLM-urile care implementează un lanț de gândire înțeleg mai bine provocările explicite și subiacente și generează răspunsuri după luarea în considerare a probabilităților distincte și a scenariilor cele mai defavorabile.
Atenuarea ipoteze și rezultate generate din ipoteze deoarece modelele aplică gândirea și procesarea logică și secvențială pentru a concluziona, mai degrabă decât a sari la concluzii.
Crescute versatilitate deoarece modelele nu trebuie să fie instruite riguros pe un nou caz de utilizare, deoarece merg după logică și nu după scop.
Optimizat coerență în sarcini care implică răspunsuri în mai multe rânduri/în mai multe părți.
Anatomia funcționării tehnicii de stimulare a lanțului de gândire
Dacă sunteți familiarizat cu arhitectura software monolitică, ați ști că întreaga aplicație software este dezvoltată ca o singură unitate coerentă. Simplificarea unei taxe atât de complexe a venit cu metoda arhitecturii microservicii care a implicat defalcarea software-ului în servicii independente. Acest lucru a dus la o dezvoltare mai rapidă a produselor și, de asemenea, o funcționalitate perfectă.
CoT prompting în AI este similar, unde LLM-urile sunt ghidate printr-o serie de procese secvențiale de raționament pentru a genera un răspuns. Aceasta se realizează prin:
- Instrucțiuni explicite, în care modelele sunt instruite direct să abordeze o problemă secvenţial prin comenzi simple.
- Instruirea implicită este mai subtilă și mai nuanțată în abordarea sa. În aceasta, un model este luat prin logica unei sarcini similare și își valorifică capacitățile de inferență și înțelegere pentru a replica logica problemelor prezentate.
- Exemple demonstrative, în care un model ar prezenta raționamentul pas cu pas și ar genera perspective incrementale pentru a rezolva o problemă.
3 situații reale în care se utilizează CoT Prompting
Modele de decizie financiară
| CoT multimodal în roboți
| Serviciul medical
|
|---|---|---|
| În acest sector extrem de volatil, îndemnul CoT poate fi folosit pentru a înțelege potențiala traiectorie financiară a unei companii, pentru a efectua evaluări ale riscurilor solicitanților de credit și multe altele. | Chatbot-urile care sunt dezvoltate și implementate pentru întreprinderi necesită funcționalități de nișă. Ei trebuie să prezinte abilități de înțelegere a diferitelor formate de intrări. Solicitarea CoT funcționează cel mai bine în astfel de cazuri, în care roboții trebuie să combine solicitări text și imagine pentru a genera răspunsuri la interogări. | De la diagnosticarea pacienților din datele privind asistența medicală până la generarea de planuri de tratament personalizate pentru pacienți, solicitarea CoT poate completa obiectivele de asistență medicală pentru clinici și spitale. |
Exemplu
Întrebare client: Am observat o tranzacție în contul meu pe care nu o recunosc, cardul meu de debit a fost pierdut și vreau să configurez alerte pentru tranzacțiile din contul meu. Ma puteti ajuta cu aceste probleme?
Pasul 1: Identificați și clasificați problemele
- Tranzacție nerecunoscută.
- Card de debit pierdut.
- Configurarea alertelor de tranzacție.
Pasul 2: Adresați tranzacția nerecunoscută
Cere detalii: Ați putea furniza data și suma tranzacției?
- Filiala 1: Dacă sunt furnizate detalii:
- Examinați tranzacția. Dacă este frauduloasă, întrebați dacă clientul dorește să o conteste.
- Filiala 2: Dacă nu există detalii:
- Oferiți să furnizați o listă a tranzacțiilor recente.
Pasul 3: Adresați cardul de debit pierdut
Înghețați cardul: Se recomandă congelarea imediată.
- Filiala 1: Dacă clientul este de acord:
- Înghețați cardul și întrebați dacă doresc o înlocuire. Confirmați adresa de livrare.
- Filiala 2: Dacă clientul refuză:
- Sfatuieste monitorizarea contului pentru tranzactii neautorizate.
Pasul 4: Configurați alerte de tranzacție
Alegeți metoda de alertă: SMS, e-mail sau ambele?
- Filiala 1: Dacă un client alege:
- Setați alerte pentru tranzacții peste o sumă specificată. Cere suma.
- Filiala 2: Dacă nu sunteți sigur:
- Sugerați o sumă implicită (de exemplu, 50 USD) și confirmați.
Pasul 5: Furnizați un rezumat și pașii următori
- Investigarea tranzacției nerecunoscute.
- Înghețarea cardului de debit și eventual emiterea unui înlocuitor.
- Configurarea alertelor de tranzacție conform solicitării.
Argumentare:
Acest proces abordează eficient întrebările multiple ale clienților prin pași clari și ramuri de decizie, asigurând soluții complete.
Limitările solicitării CoT

Lanțul de gândire este într-adevăr eficient, dar este, de asemenea, supus cazului de utilizare în care este aplicat și mai multor alți factori. Există provocări specifice asociate cu CoT prompting în AI care împiedică părțile interesate să-și valorifice complet potențialul. Să ne uităm la blocajele comune:
Complicați prea mult sarcinile simple
În timp ce solicitarea CoT funcționează cel mai bine pentru sarcini complexe, poate complica sarcinile simple și poate genera răspunsuri greșite. Pentru sarcinile care nu necesită raționament, modelele cu răspuns direct funcționează cel mai bine.
Sarcină de calcul crescută
Procesarea solicitării CoT necesită o sarcină de calcul semnificativă și, dacă tehnica este implementată pe modele mai mici care sunt construite cu abilități limitate de procesare, le poate copleși. Consecințele unor astfel de implementări pot include timpi de răspuns mai lenți, eficiență slabă, incoerență și multe altele.
Calitatea ingineriei prompte AI
CoT prompting în AI funcționează pe baza ipotezei (sau principiului) că un anumit prompt este bine articulat, structurat și clar. Dacă unui prompt îi lipsesc acești factori, solicitarea CoT își pierde capacitatea de a înțelege cerința, ceea ce duce la generarea de pași secvențiali irelevanți și, în cele din urmă, răspunsuri.
[Citește și: Ce sunt modelele lingvistice mici? Exemple din lumea reală și date de antrenament]
Capacități reduse la scară
Părțile interesate pot experimenta modelele lor care se luptă dacă trebuie să folosească îndemnul lanțului de gândire pentru volume masive de seturi de date sau complexitatea problemelor. Pentru sarcinile care implică pași mai mari de raționament, tehnica poate încetini timpul de răspuns, făcând-o inadecvată pentru aplicații sau cazuri de utilizare care necesită generarea de răspuns în timp real.
CoT prompting este o tehnică fenomenală de optimizare a performanței Modele de limbaj mari. Dacă astfel de deficiențe pot fi abordate și rezolvate prin tehnici de optimizare sau soluții alternative, ele pot da rezultate incredibile. Pe măsură ce tehnologia avansează, va fi interesant să vedem cum evoluează îndemnul Chain-of-Thought și devine mai simplu, dar și mai de nișă.





