Solicitări de plată UPI bazate pe voce: captarea diversității pentru modele de IA îmbunătățite
Folosind expertiza Shaip în crearea promptă și înregistrările audio diverse pentru a sprijini sistemele de plată UPI bazate pe voce, cu date de înaltă calitate, diverse din punct de vedere cultural.
rezumatul proiectului
Shaip a colaborat cu o companie de top fintech pentru a dezvolta o aplicație de plată bazată pe voce, creând și înregistrând diverse solicitări de plată UPI. Proiectul a implicat crearea a 2,500 de solicitări unice și 87,000 de solicitări diversificate în 13 intenții legate de plată, cum ar fi trimiterea de bani, solicitarea de bani, consultarea soldului și plățile facturilor. Aceste solicitări au fost înregistrate peste 200 de ore de către 45 de vorbitori din diverse regiuni, medii și grupuri de vârstă, asigurând o gamă largă de diversitate lingvistică și de mediu.
Scopul proiectului a fost de a dezvolta date de instruire de înaltă calitate pentru un model AI care poate recunoaște și răspunde la comenzile vocale legate de plățile UPI în setările din lumea reală.

Statistici cheie
Au fost înregistrate ore audio ale solicitărilor de plată UPI
200
Vorbitori din medii diverse (vârstă, educație, regiune)
45
Intenții acoperite, cu peste 87,000 de solicitări diversificate
13
limbi: Engleză, cu vorbitori din diferite medii de limbă maternă (Kumaoni, Bengali, Malayalam, Gujarati, Hindi, Marathi etc.)
Domeniul de aplicare al proiectului
Creare promptă
Scopul a inclus crearea de solicitări unice pentru un sistem de plată UPI bazat pe voce. Solicitările au fost concepute pentru a acoperi mai multe intenții, asigurându-se că acestea sunt diverse ca structură, vocabular și entități denumite. Unele aspecte cheie au inclus:
13 intenții cheie, inclusiv:
- Trimite bani: 65,653 de solicitări unice și diversificate
- Solicitare sold: 3,052 de solicitări
- Solicită bani: 26,972 de solicitări
- Istoricul tranzacțiilor, reîncărcarea, plata facturilor etc.
Inregistrare audio
Pentru a asigura autenticitatea și aplicabilitatea în lumea reală, solicitările au fost înregistrate de 45 de vorbitori din medii lingvistice diferite. Diversitatea surprinsă prin diferite limbi native, dialecte regionale și medii (interioare și exterioare) a contribuit la îmbunătățirea datelor de formare.
- Diversitatea limbii: Utilizatori vorbesc fluent engleza, dar cu limbi materne variate, cum ar fi Kumaoni, Gujarati, Hindi, Bangla, Marathi și Malayalam.
- Vârsta, sexul și mediul educațional: Datele au captat o gamă largă de date demografice.
- Vorbitori urbani și rurali: Pentru a reflecta utilizarea în lumea reală, au fost incluși atât vorbitorii urbani, cât și cei din mediul rural.
- Mediu de înregistrare: Înregistrările audio au fost efectuate atât în interior, cât și în exterior, cu o varietate de zgomote de fundal incluse.
Provocări
Asigurarea că indicațiile reflectă diverse dialecte regionale și caracteristicile vorbitorului a necesitat o planificare și execuție atentă.
Gestionarea zgomotelor de fond și a condițiilor de mediu (interioare vs. exterioare) a fost crucială pentru aplicarea în lumea reală.
Includerea vorbitorilor din diferite grupe de vârstă, medii educaționale și regiuni rurale/urbane a introdus complexitate în captarea datelor autentice.
Soluţie
Shaip a livrat o soluție care a abordat provocările proiectului prin implementarea tehnicilor avansate NLP și planificarea atentă atât în crearea cât și în înregistrarea promptă. Aspecte cheie ale
soluția a inclus:
Creare promptă
- 2,500 au fost create prompturi unice, fiecare diversificat prin structură și vocabular.
- 13 au fost acoperite intențiile, variind de la solicitări de plată de bază până la întrebări mai complexe, cum ar fi istoricul tranzacțiilor și plățile facturilor.
Inregistrare audio
- 200 ore a înregistrărilor audio au fost realizate de 45 utilizatori, asigurând diversitatea în diferite limbi materne, medii și demografii ale vorbitorilor.
- Atât mediile interioare, cât și cele exterioare au fost folosite pentru înregistrare pentru a asigura o variație naturală a sunetului.
- Vorbitorii reprezentau o serie de dialecte regionale, asigurând o reprezentare lingvistică corectă.
Scop | Trimiteți | Anchetă de echilibru | Solicită bani | Istoricul tranzactiilor |
---|---|---|---|---|
Prompt | Fă o plată de douăzeci și o sută către Sumatri pentru chirie | Vreau să cunosc soldul meu curent în contul meu de economii. | Poți să-i ceri lui Raji trei sute optsprezece rupii pentru o urgență? | Arată-mi istoricul tranzacțiilor cu cardul meu de debit. |
Gujarati | સુમાત્રીને ઘરના ભાડા પેટે એકવીસસઋચો ચડા | હું મારા બચત ખાતામાં મારી વર્તમાન બાેબાેબાં વા માંગુ છું. | શું તમે રાજી પાસેથી ઇમર્જન્સી માટી માટે ઢતે ઢતે ર્મર્જન્સી ર રૂપિયા માંગી શકો છો? | મને મારા ડેબિટ કાર્ડના વ્યવહાર દેડર્ડના. |
hindi | सुमात्री को मकान किराए के लिए इक्कीर्कीसएराए ा भुगतान करें | | मैं अपने बचत खाते में वर्तमान शेष रानानानाना रें ाहता हूँ। | क्या आप राजी से किसी इमरजेंसी के लिे लिसनिसी इमरजेंसी रह रुपये मांग सकते हैं? | मुझे मेरा डेबिट कार्ड का लेनदेन बेबिट र।्य।्ड का |
malayalam | വീട്ടുവാടകയായി സുമത്രിക്ക് രണ്്രണ്ടാരരരരരരിത്രിക്ക് ന്നൂറ് നൽകൂ. | എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലെ നിലവിലവികവിഅകകൗണ്ടിലെ ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു. | രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രുന്നൂറ്റി വശ്യത്തിന് ആവശ്യപ്പെടാമോ? | എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവരണകവരണംവണം കാർഡ്. |
telugu | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒరవై ఒకోసఱ్ల ర్రికి ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్ింగ్స్ కౌంట్ ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను. | ఎమర్జెన్సీ కోసం రాజిని మూడు వందన్సీ రాజిని రూపాయలు అడగగలరా? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రిత్ార్డ్ లావాదేవీ చరిత్రిత్రనఱఱఱ ంచండి. |
Bangla বাংলা | বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০াદা০০০ ০০ ্য োধ করুন | আমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমর্তম্যাকাউন্টে বর্তমর্তম২দন্যাকাউন্টে স জানতে চাই। | আপনি রাজির কাছে তাৎক্ষণিক অবস্থাস্থার দনড়নৎক্ষণিক আঠারো টাকাচেয়ে নিতে পারেন? | আমার ডেবিট কার্ডের লেনদেনের ইতিহােস নাের |
marathi | सुमात्री ला घरा चे रेंट साठी दोन हजररररररारंट ुपये चुकवा | मला माये बचत खाते मधी चालू बॅलन्स जाहाहाही | काय तुम्ही राजी पासून तीन सो अठराह राह राँरून तीन सो शकते इमरजेंसी साठी ? | मला माझे डेबिट कार्ड चे लेन देन दाखवा खवा |
Rezultat
Datele audio de înaltă calitate și diverse furnizate de Shaip au permis clientului să dezvolte un sistem de plată UPI bazat pe voce, bazat pe AI, capabil să recunoască comenzi în diferite dialecte, medii și contexte. Datele au contribuit la îmbunătățirea:
- Recunoaștere vocală în timp real în medii complexe.
- Tranzacție UPI mai precisă manipulare pentru o gamă mai largă de utilizatori.
- scalabilitate: Proiectul stabilește o bază solidă pentru extinderea în alte limbi indiene.
livrabile
- 200 ore de fișiere audio (format PCM WAV de 8 kHz, mono)
- 87,000+ prompturi diversificate adnotate cu intentii unice
- Metadate: Profilurile difuzorului, detaliile mediului și acuratețea transcripției
Capacitatea lui Shaip de a surprinde diversitatea Indiei prin solicitări unice și înregistrări audio autentice a schimbat jocul pentru sistemul nostru de plată UPI bazat pe voce. Echipa lor s-a asigurat că fiecare aspect al proiectului – de la crearea promptă până la calitatea înregistrării – a fost tratat cu precizie, ajutându-ne să construim un model de recunoaștere a vocii mai incluziv și mai robust.