Definiție
Generarea augmentată de recuperare a informațiilor (RAG) este o tehnică ce combină modele generative cu sisteme de recuperare a informațiilor. Aceasta bazează rezultatele pe surse externe pentru a îmbunătăți acuratețea factuală.
Scop
Scopul este de a reduce halucinațiile în IA generativă prin completarea răspunsurilor cu documente recuperate. Este util în special în sarcinile care necesită răspunsuri la întrebări și cunoștințe.
Importanță
- Îmbunătățește acuratețea factuală a rezultatelor LLM.
- Permite integrarea cunoștințelor specifice domeniului.
- Necesită sisteme de recuperare fiabile.
- Legat de căutarea hibridă și de asigurarea calității în domenii deschise.
Cum funcționează
- Utilizatorul furnizează o interogare sau o solicitare.
- Sistemul de recuperare preia documentele relevante.
- Documentele sunt transmise într-un model generativ.
- Modelul generează răspunsuri bazate pe conținutul recuperat.
- Buclele de feedback îmbunătățesc performanța viitoare.
Exemple (din lumea reală)
- OpenAI ChatGPT cu pluginuri de navigare sau recuperare.
- Modelul Meta RAG: cercetare asupra LLM-urilor bazate pe recuperare.
- Perplexity AI: căutare conversațională augmentată prin recuperare.
Referințe/Lecturi suplimentare
- Lewis și colab. „Generare augmentată prin recuperare pentru NLP intensivă în cunoștințe.” NeurIPS 2020.
- Implementarea RAG-ului pentru îmbrățișarea feței.
- Cercetare Stanford HAI privind metodele de recuperare.
- Ce este RAFT? RAG + Reglare fină