Solicitări de plată UPI bazate pe voce: captarea diversității pentru modele de IA îmbunătățite

Folosind expertiza Shaip în crearea promptă și înregistrările audio diverse pentru a sprijini sistemele de plată UPI bazate pe voce, cu date de înaltă calitate, diverse din punct de vedere cultural.

Solicitări de plată UPI bazate pe voce

rezumatul proiectului

Shaip a colaborat cu o companie de top fintech pentru a dezvolta o aplicație de plată bazată pe voce, creând și înregistrând diverse solicitări de plată UPI. Proiectul a implicat crearea a 2,500 de solicitări unice și 87,000 de solicitări diversificate în 13 intenții legate de plată, cum ar fi trimiterea de bani, solicitarea de bani, consultarea soldului și plățile facturilor. Aceste solicitări au fost înregistrate peste 200 de ore de către 45 de vorbitori din diverse regiuni, medii și grupuri de vârstă, asigurând o gamă largă de diversitate lingvistică și de mediu.

Scopul proiectului a fost de a dezvolta date de instruire de înaltă calitate pentru un model AI care poate recunoaște și răspunde la comenzile vocale legate de plățile UPI în setările din lumea reală.

Plată upi pe bază de voce

Statistici cheie

Au fost înregistrate ore audio ale solicitărilor de plată UPI

200

Vorbitori din medii diverse (vârstă, educație, regiune)

45

Intenții acoperite, cu peste 87,000 de solicitări diversificate

13

limbi: Engleză, cu vorbitori din diferite medii de limbă maternă (Kumaoni, Bengali, Malayalam, Gujarati, Hindi, Marathi etc.)

Domeniul de aplicare al proiectului

Creare promptă

Scopul a inclus crearea de solicitări unice pentru un sistem de plată UPI bazat pe voce. Solicitările au fost concepute pentru a acoperi mai multe intenții, asigurându-se că acestea sunt diverse ca structură, vocabular și entități denumite. Unele aspecte cheie au inclus:

13 intenții cheie, inclusiv:

  • Trimite bani: 65,653 de solicitări unice și diversificate
  • Solicitare sold: 3,052 de solicitări
  • Solicită bani: 26,972 de solicitări
  • Istoricul tranzacțiilor, reîncărcarea, plata facturilor etc.

Inregistrare audio

Pentru a asigura autenticitatea și aplicabilitatea în lumea reală, solicitările au fost înregistrate de 45 de vorbitori din medii lingvistice diferite. Diversitatea surprinsă prin diferite limbi native, dialecte regionale și medii (interioare și exterioare) a contribuit la îmbunătățirea datelor de formare.

  • Diversitatea limbii: Utilizatori vorbesc fluent engleza, dar cu limbi materne variate, cum ar fi Kumaoni, Gujarati, Hindi, Bangla, Marathi și Malayalam.
  • Vârsta, sexul și mediul educațional: Datele au captat o gamă largă de date demografice.
  • Vorbitori urbani și rurali: Pentru a reflecta utilizarea în lumea reală, au fost incluși atât vorbitorii urbani, cât și cei din mediul rural.
  • Mediu de înregistrare: Înregistrările audio au fost efectuate atât în ​​interior, cât și în exterior, cu o varietate de zgomote de fundal incluse.

Provocări

Diversitatea lingvistică și regională

Asigurarea că indicațiile reflectă diverse dialecte regionale și caracteristicile vorbitorului a necesitat o planificare și execuție atentă.

Variații audio naturale

Gestionarea zgomotelor de fond și a condițiilor de mediu (interioare vs. exterioare) a fost crucială pentru aplicarea în lumea reală.

Profiluri diverse ale difuzorului

Includerea vorbitorilor din diferite grupe de vârstă, medii educaționale și regiuni rurale/urbane a introdus complexitate în captarea datelor autentice.

Soluţie

Shaip a livrat o soluție care a abordat provocările proiectului prin implementarea tehnicilor avansate NLP și planificarea atentă atât în ​​crearea cât și în înregistrarea promptă. Aspecte cheie ale
soluția a inclus:

Creare promptă

  • 2,500 au fost create prompturi unice, fiecare diversificat prin structură și vocabular.
  • 13 au fost acoperite intențiile, variind de la solicitări de plată de bază până la întrebări mai complexe, cum ar fi istoricul tranzacțiilor și plățile facturilor.

Inregistrare audio

  • 200 ore a înregistrărilor audio au fost realizate de 45 utilizatori, asigurând diversitatea în diferite limbi materne, medii și demografii ale vorbitorilor.
  • Atât mediile interioare, cât și cele exterioare au fost folosite pentru înregistrare pentru a asigura o variație naturală a sunetului.
  • Vorbitorii reprezentau o serie de dialecte regionale, asigurând o reprezentare lingvistică corectă.
ScopTrimitețiAnchetă de echilibruSolicită baniIstoricul tranzactiilor
PromptFă o plată de douăzeci și o sută către Sumatri pentru chirieVreau să cunosc soldul meu curent în contul meu de economii.Poți să-i ceri lui Raji trei sute optsprezece rupii pentru o urgență?
Arată-mi istoricul tranzacțiilor cu cardul meu de debit.
Gujaratiસુમાત્રીને ઘરના ભાડા પેટે એકવીસસ૵ઋચો ચડાહું મારા બચત ખાતામાં મારી વર્તમાન બાેબાેબાં વા માંગુ છું.શું તમે રાજી પાસેથી ઇમર્જન્સી માટી માટે ઢતે ઢતે ર્મર્જન્સી ર રૂપિયા માંગી શકો છો?મને મારા ડેબિટ કાર્ડના વ્યવહાર દેડર્ડના.
hindiसुमात्री को मकान किराए के लिए इक्कीर्कीसएराए ा भुगतान करें |मैं अपने बचत खाते में वर्तमान शेष रानानानाना रें ाहता हूँ।क्या आप राजी से किसी इमरजेंसी के लिे लिसनिसी इमरजेंसी रह रुपये मांग सकते हैं?मुझे मेरा डेबिट कार्ड का लेनदेन बेबिट र।्य।्ड का
malayalamവീട്ടുവാടകയായി സുമത്രിക്ക് രണ്്രണ്ടാരരരരരരിത്രിക്ക് ന്നൂറ് നൽകൂ.എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലെ നിലവിലവികവിഅകകൗണ്ടിലെ ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു.രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രുന്നൂറ്റി വശ്യത്തിന് ആവശ്യപ്പെടാമോ?എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവരണകവരണംവണം കാർഡ്.
teluguఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒరవై ఒకోసఱ్ల ర్రికి ించండినేను నా సేవింగ్స్ అకౌంట్ లో నా ప్ింగ్స్ కౌంట్ ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను.ఎమర్జెన్సీ కోసం రాజిని మూడు వందన్సీ రాజిని రూపాయలు అడగగలరా?నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రిత్ార్డ్ లావాదేవీ చరిత్రిత్రన౰ఱఱఱ ంచండి.
Bangla বাংলাবাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০াદা০০০ ০০ ্য োধ করুনআমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমর্তম্যাকাউন্টে বর্তমর্তম২দন্যাকাউন্টে স জানতে চাই।আপনি রাজির কাছে তাৎক্ষণিক অবস্থাস্থার ৤দনড়ন৤ৎক্ষণিক আঠারো টাকাচেয়ে নিতে পারেন?আমার ডেবিট কার্ডের লেনদেনের ইতিহােস নাের
marathiसुमात्री ला घरा चे रेंट साठी दोन हजररररररारंट ुपये चुकवामला माये बचत खाते मधी चालू बॅलन्स जाहाहाहीकाय तुम्ही राजी पासून तीन सो अठराह राह राँरून तीन सो शकते इमरजेंसी साठी ?मला माझे डेबिट कार्ड चे लेन देन दाखवा खवा

Rezultat

Datele audio de înaltă calitate și diverse furnizate de Shaip au permis clientului să dezvolte un sistem de plată UPI bazat pe voce, bazat pe AI, capabil să recunoască comenzi în diferite dialecte, medii și contexte. Datele au contribuit la îmbunătățirea:

  • Recunoaștere vocală în timp real în medii complexe.
  • Tranzacție UPI mai precisă manipulare pentru o gamă mai largă de utilizatori.
  • scalabilitate: Proiectul stabilește o bază solidă pentru extinderea în alte limbi indiene.

livrabile

  • 200 ore de fișiere audio (format PCM WAV de 8 kHz, mono)
  • 87,000+ prompturi diversificate adnotate cu intentii unice
  • Metadate: Profilurile difuzorului, detaliile mediului și acuratețea transcripției

Capacitatea lui Shaip de a surprinde diversitatea Indiei prin solicitări unice și înregistrări audio autentice a schimbat jocul pentru sistemul nostru de plată UPI bazat pe voce. Echipa lor s-a asigurat că fiecare aspect al proiectului – de la crearea promptă până la calitatea înregistrării – a fost tratat cu precizie, ajutându-ne să construim un model de recunoaștere a vocii mai incluziv și mai robust.

Golden-5-stele