Cele mai de încredere servicii de colectare a datelor despre vorbire pentru IA dvs
Antrenați-vă modelele NLP, VA, prototipurile TTS și multe altele cu date conversaționale de calitate, cu serviciile noastre de colectare a datelor audio și de vorbire
Descoperiți conducte de date audio fără blocaje
Clienți prezentați
Servicii profesionale de colectare a datelor audio/voce
Orice subiect. Orice scenariu.
La Shaip, expertiza noastră constă în crearea de seturi de date de vorbire de înaltă calitate, concepute pentru cerințe variate AI/ML. Oferim o gamă extinsă de limbi și înregistrăm în diverse setări, făcând seturile noastre de date cuprinzătoare și adaptabile. Oaccentul se pune pe furnizarea de modele cu cel mai mare volum de date de vorbire personalizate, în cel mai mic timp posibil. Cu noi la bord, vă puteți aștepta la:
- Date audio/voce multilingve de înaltă calitate pentru a îmbunătăți acuratețea
- Cel mai înalt nivel posibil de specificitate a domeniului pentru target scenariu divers configurarea
- Scalați-vă modelul ML pentru a se potrivi cu diverse categorii demografice și verticale
- Medii de înregistrare: Calitate studio, oferind un sunet clar, cu zgomot de fundal minim și Mediile naturale, unde înregistrările încorporează sunete ambientale pentru a imita situațiile din lumea reală.
100+
55K +
Date despre orele de vorbire
250+
Proiecte
60+
Limbi (100+ dialecte)
8 / 16 / 44 / 48 kHz
Rata de eșantionare
Expertiza noastră
Aliniați datele audio la pentru modele NLP mai inteligente
Shaip oferă servicii de colectare de date de vorbire/audio de la capăt la capăt în peste 100 de limbi pentru a permite tehnologiilor activate de voce să răspundă unui set divers de public de pe tot globul. Putem lucra la proiecte de orice anvergură și dimensiune; de la acordarea de licențe a seturilor de date audio existente, până la gestionarea colecției de date audio personalizate, la transcrierea și adnotarea audio. Indiferent cât de mare este proiectul dvs. de colectare a datelor despre vorbire, putem personaliza serviciile de colectare audio pentru a se potrivi nevoilor dvs. pentru a construi seturi de date NLP de înaltă calitate care vizează dialectele, tonurile și limbile. Alegeți din gama noastră largă de seturi de date despre vorbire și resurse de colectare a datelor audio, pentru setări inteligente care permit vocea.
Monolog scenariu și discurs spontan
Se concentrează pe procesarea vorbirii de la un singur vorbitor. Utilizați instrucțiuni scriptate pentru a alimenta fișiere audio cu un singur canal, asigurând capturarea de modele de vorbire, tonuri și nuanțe unice specifice individului respectiv.
Dialog scenariu și discurs spontan
Interacțiunea a două persoane, reproducând conversațiile și dialogurile din lumea reală cu expunere multilingvă prin fișiere cu două canale și resurse transcrise.
Grup / Muti-party
conversaţii
Discuții cu mai multe persoane, captarea dinamicii grupului, suprapuneri și tonuri variate, astfel încât să antreneze cu precizie modelele de vorbire.
Cuvânt de trezire / Expresie cheie / Colecție de expresii
Antrenați AI pentru a identifica fraze cheie sau cuvinte trezite sau enunțuri cu semnificații similare, folosind enunțuri diverse, bogate și autentice pentru procesarea și înțelegerea avansată a limbajului natural.
Date acustice
Colectie
Putem înregistra profesional date audio la calitate de studio, fie că este vorba de restaurante, birouri sau case sau din diverse medii și limbi, acoperind în același timp o gamă acustică mai largă (Seturi de date complete de sunet).
Recunoaștere automată a vorbirii (ASR)
Îmbunătățiți acuratețea sistemelor dvs. de recunoaștere automată a vorbirii (ASR) având acces la seturi de date audio/vorbire diversificate de ultimă generație, dintr-o gamă largă de date demografice.
Date de antrenament audio/vorbire multilingve
Profesioniștii noștri calificați în limbi străine din întreaga lume oferă date audio/vorbire multilingve în diferite limbi și dialecte. Acest efort încurajează comunicarea globală și depășește barierele lingvistice, contribuind la soluții AI mai incluzive și mai eficiente.
Text-to-Speech
(TTS)
Construiți un model multilingv de text-to-speech (TTS) cu ajutorul forței noastre de muncă globale, care vă ajută să colectați date de vorbire în peste 150 de limbi și dialecte pentru a vă îmbunătăți modelele AI, de la comenzile din mașină la chatbot și soluții de învățare cu date audio de calitate.
Call Center
conversaţii
Schimburi autentice între agenți și clienți, care acceptă numeroase limbi precum spaniolă, germană, engleză americană, bengaleză, japoneză, chineză și hindi.
pentru Manșon Gastric
Seturi de date AI conversaționale cu peste 3 de ore de date în 8 limbi
În căutarea de a construi o platformă multilingvă pentru limbile indiene, clientul a colaborat cu Shaip pentru a colecta, segmenta și transcrie seturi mari de date în mai multe limbi indiene. Acest lucru ar ajuta la dezvoltarea modelelor de vorbire eficiente care ar putea alimenta noua platformă inovatoare a clientului.
Problemă: Peste 3,000 de ore de date audio colectate în 8 limbi indiene, segmentate și transcrise pentru a dezvolta recunoașterea automată a vorbirii.
Soluţie: Am furnizat colectarea datelor, segmentarea, transcrierea și livrat fișiere JSON cu metadate. Am colectat 3000 de ore de date audio în 8 limbi indiene la scară pentru proiectul de tehnologie de vorbire al clientului.
Motive pentru a alege Shaip ca partener de încredere pentru colectarea datelor despre vorbire
oameni
Echipe dedicate și pregătite:
- Peste 30,000 de colaboratori pentru crearea datelor, etichetare și asigurare a calității
- Echipa de management de proiect acreditată
- Echipa de dezvoltare a produselor cu experiență
- Echipa Talent Pool Sourcing & Onboarding
Proces
Cea mai mare eficiență a procesului este asigurată cu:
- Proces robust 6 Sigma Stage-Gate
- O echipă dedicată de centuri negre 6 Sigma – proprietari cheie de proces și conformitate cu calitatea
- Îmbunătățire continuă și buclă de feedback
Platformă
Platforma patentata ofera beneficii:
- Platformă end-to-end bazată pe web
- Calitate impecabilă
- TAT mai rapid
- Livrare fără întreruperi
oameni
Echipe dedicate și pregătite:
- Peste 30,000 de colaboratori pentru crearea datelor, etichetare și asigurare a calității
- Echipa de management de proiect acreditată
- Echipa de dezvoltare a produselor cu experiență
- Echipa Talent Pool Sourcing & Onboarding
Proces
Cea mai mare eficiență a procesului este asigurată cu:
- Proces robust 6 Sigma Stage-Gate
- O echipă dedicată de centuri negre 6 Sigma – proprietari cheie de proces și conformitate cu calitatea
- Îmbunătățire continuă și buclă de feedback
Platformă
Platforma patentata ofera beneficii:
- Platformă end-to-end bazată pe web
- Calitate impecabilă
- TAT mai rapid
- Livrare fără întreruperi
Seturi de date pentru vorbire/audio disponibile
Detalii | ID corpus (unic) | Cuvânt cheie | Set de date de limbă | Cod de limbă | Rata simpla | Tipul setului de date | Numărul total de ore audio | Descriere pe scurt | Descrierea setului de date | Canal audio | Platformă de înregistrare | NOI SUNTEM (%) | Format audio | Format de transcriere | Utilizare caz | Număr de vorbitori | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York English_GC_8 | New York engleză | New York engleză | ro_ | 8 kHz | Conversație generală | 107 | Date despre conversația generală în limba engleză din New York | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 118, Bărbat 114, Necunoscut 0 | Contact | |
Russian_SM_48 | Rusă | Rusă | ru-ru | 48 kHz | Monolog scenariu | 2,398 | Monolog cu scenariu rusesc | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1689 Bărbat 1937 Necunoscut 214 | Contact | |
Punjabi_MA | Punjabi | Punjabi (În conductă) | Punjabi | Media Audio | 40 | Punjabi (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Punjabi_GC | Punjabi | Punjabi (În conductă) | Punjabi | Conversație generală | 100 | Punjabi (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Punjabi_CC_8 | Punjabi | Punjabi (În conductă) | Punjabi | Call center | 60 | Punjabi (In Pipeline) Date call-center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
poloneză Polonia_SM_48 | Poloneză (Polonia) | Poloneză (Polonia) | pl-pl | 48 kHz | Monolog scenariu | 1,482 | Polonia poloneză - Monolog scenariu | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1324 Bărbat 701 Necunoscut 24 | Contact | |
poloneză_MA_16 | Poloneză | Poloneză | pl_PL | 16 kHz | Media Audio | 269 | Audio media poloneză | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 173 Bărbat 354 Necunoscut 6 | Contact | |
Oriya_MA | oriya | Oriya (În conductă) | sau_IN | Media Audio | 40 | Oriya (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Oriya_GC | oriya | Oriya (În conductă) | sau_IN | Conversație generală | 100 | Oriya (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Oriya_CC_8 | oriya | Oriya (În conductă) | sau_IN | Call center | 60 | Oriya (In Pipeline) Datele Call Center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Noua Zeelandă_MA_16 | engleză din Noua Zeelandă | engleză din Noua Zeelandă | ro_NZ | 16 kHz | Media Audio | 400 | Audio media engleză din Noua Zeelandă | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 367, bărbat 678, Necunoscut 26 | Contact | |
Noua Zeelandă_GC_8 | engleză din Noua Zeelandă | engleză din Noua Zeelandă | ro_NZ | 8 kHz | Conversație generală | 148 | Date de conversație generală în limba engleză din Noua Zeelandă | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 167, bărbat 121, Necunoscut 4 | Contact | |
New York English_MA_16 | New York engleză | New York engleză | ro_ | 16 kHz | Media Audio | 140 | Date audio New York English Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 66, Bărbat 230, Necunoscut 11 | Contact | |
Scottish_GC_8 | scoțian (accent englezesc) | scoțian (accent englezesc) | ro_AB | 8 kHz | Conversație generală | 292 | Date despre conversația generală din Scoția | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 285, Bărbat 260, Necunoscut 3 | Contact | |
New York English_CC_8 | New York engleză | New York engleză | ro_ | 8 kHz | Call center | 103 | New York English Date call-center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 610, Bărbat 532, Necunoscut 0 | Contact | |
Olanda_SM_48 | Olandeză | Olandeză | nl-NL | 48 kHz | Monolog scenariu | 1,205 | Monolog cu scenariu olandez | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1285 Bărbat 531 Necunoscut 3 | Contact | |
Mexican_SM_48 | Spaniolă (Mexic) | Spaniolă (Mexic) | ro-MX | 48 kHz | Monolog scenariu | 1,492 | Monolog cu scenariu mexican spaniol | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1016 Bărbat 1069 Necunoscut 95 | Contact | |
Marathi_MA | marathi | Marathi (În conductă) | mr_IN | Media Audio | 40 | Marathi (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Marathi_GC | marathi | Marathi (În conductă) | mr_IN | Conversație generală | 100 | Marathi (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Marathi_CC_8 | marathi | Marathi (În conductă) | mr_IN | Call center | 60 | Date de la Call-Center Marathi (In Pipeline). | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Malayalam_MA | malayalam | Malayalam (În conductă) | ml_IN | Media Audio | 40 | Malayalam (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Malayalam_GC | malayalam | Malayalam (În conductă) | ml_IN | Conversație generală | 100 | Malayalam (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Malayalam_CC_8 | malayalam | Malayalam (În conductă) | ml_IN | Call center | 60 | Malayalam (In Pipeline) Date call-center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Malay_MA_16 | malaezian | malaezian | ms_MY | 16 kHz | Media Audio | 344 | Date audio Malay Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 236, Bărbat 626, Necunoscut 47 | Contact | |
Malay_GC_8 | malaezian | malaezian | ms_MY | 8 kHz | Conversație generală | 266 | Date despre conversația generală malaeză | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, malay în Malaezia | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 316, Bărbat 176, Necunoscut 0 | Contact | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Conversație generală | 553 | Telugu General Conversation date | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 574, Bărbat 564, Necunoscut 0 | Contact | |
UK English_WW_16 | Marea Britanie | Marea Britanie | ro_uk | 16 kHz | Wake Word | Difuzoarele 200 | Wake Word engleză britanică | fraze cheie colectare de date
| canal 1 | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Sex: 50% bărbați, 50% femei, +/- 10%. | Contact | |
Welsh_GC_8 | Welsh (accent englezesc) | Welsh (accent englezesc) | ro_WL | 8 kHz | Conversație generală | 278 | Date despre conversația generală galeză | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 270, Bărbat 324, Necunoscut 0 | Contact | |
vietnameză_MA_16 | Vietnameză | Vietnameză | vi_VN | 16 kHz | Media Audio | 257 | Date audio media vietnameze | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 249, bărbat 200, Necunoscute 45 | Contact | |
vietnameză_GC_8 | Vietnameză | Vietnameză | vi_VN | 8 kHz | Conversație generală | 295 | Date de conversație generală vietnameză | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, nord (de exemplu, Hanoi), centru și sud (de exemplu, orașul Ho Chi Minh). | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 400, bărbat 380, Necunoscute 2 | Contact | |
Turcia Turcia_SM_48 | Turcia turcească | Turcia turcească | tr-TR | 48 kHz | Monolog scenariu | 2,027 | Turcia turcească | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1561 Bărbat 1241 Necunoscut 31 | Contact | |
Thai_MA_8 | Thailandeză | Thailandeză | th_TH | 16 kHz | Media Audio | 173 | Audio media thailandez | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 143, Bărbat 502, Necunoscut 26 | Contact | |
Thai_GC_8 | Thailandeză | Thailandeză | th_TH | 8 kHz | Conversație generală | 183 | Conversație generală thailandeză | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, un registru informal folosit între prieteni | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 338, Bărbat 96, Necunoscut 8 | Contact | |
Telugu_MA | telugu | Telugu (În conductă) | te_IN | Media Audio | 20 | Telugu (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Telugu_GC | telugu | Telugu (În conductă) | te_IN | Conversație generală | 50 | Telugu (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Telugu_CC_8 | telugu | Telugu (În conductă) | te_IN | Call center | 30 | Telugu (In Pipeline) Date call-center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Media Audio | 648 | Date audio Telugu Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 207, Bărbat 963, Necunoscut 2 | Contact | |
Korean_SM_48 | Coreeană | Coreeană | ko-KR | 48 kHz | Monolog scenariu | 1,955 | Monolog cu scenariu coreean | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1195 Bărbat 1134 Necunoscut 122 | Contact | |
Tamil_MA | tamil | Tamil (În conductă) | ta_IN | Media Audio | 40 | Tamil (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Tamil_GC | tamil | Tamil (În conductă) | ta_IN | Conversație generală | 100 | Tamil (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Tamil_CC_8 | tamil | Tamil (În conductă) | ta_IN | Call center | 60 | Date din call-center tamil (în conductă). | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
suedeză_MA_16 | Suedeză | Suedeză | sv_SE | 16 kHz | Media Audio | 278 | Date audio media suedeză | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 195, bărbat 500, Necunoscut 21 | Contact | |
suedeză_CC_8 | Suedeză | Suedeză | sv_SE | 8 kHz | Call center | 250 | Datele call-centerului suedez | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1581, bărbat 727, Necunoscut 2 | Contact | |
Swahili_MA_16 | Swahili | Swahili | sw_KE | 16 kHz | Media Audio | 265 | Date audio Swahili Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 118, Bărbat 493, Necunoscut 25 | Contact | |
Swahili_CC_8 | Swahili | Swahili | sw_KE | 8 kHz | Call center | 230 | Datele call-centerului swahili | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 611, Bărbat 833, Necunoscut 0 | Contact | |
engleză sud-africană_MA_16 | engleză sud-africană | engleză sud-africană | ro_ZA | 16 kHz | Media Audio | 251 | Date audio media engleză din Africa de Sud | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 235, Bărbat 432, Necunoscut 36 | Contact | |
engleză sud-africană_CC_8 | engleză sud-africană | engleză sud-africană | ro_ZA | 8 kHz | Call center | 261 | Datele centrului de apel în engleză din Africa de Sud | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1274 , Bărbat 935 , Necunoscut 1 | Contact | |
Singapore_MA_16 | Singapore engleză | Singapore engleză | ro_SG | 16 kHz | Media Audio | 247 | Date audio Singapore Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 160, Bărbat 455, Necunoscut 37 | Contact | |
Singapore_CC_8 | Singapore engleză | Singapore engleză | ro_SG | 8 kHz | Call center | 218 | Date din centrul de apeluri din Singapore | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 2139, Bărbat 884, Necunoscut 21 | Contact | |
Boston_CC_8 | Boston engleză | Boston engleză | ro_ | 8 kHz | Call center | 177 | Datele din centrul de apeluri din Boston | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 605, Bărbat: 711 și Necunoscut: 0 | Contact | |
Engleză Deep South_CC_8 | Sudul Adanc englezesc | Sudul Adanc englezesc | ro_ | 8 kHz | Call center | 151 | Engleză Deep South Call-center de date | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 221 , Bărbat 1004 , Necunoscut 7 | Contact | |
Danish_SM_48 | daneză | daneză | da-DK | 48 kHz | Monolog scenariu | 2,579 | Monolog cu scenariu danez | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde, daneză din Danemarca | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1551 Bărbat 1233 Necunoscut 42 | Contact | |
danez_MA_16 | daneză | daneză | da_DK | 16 kHz | Media Audio | 664 | Date audio Danish Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 369, Bărbat: 864, Necunoscut: 27 | Contact | |
Danish_GC_8 | daneză | daneză | da_DK | 8 kHz | Conversație generală | 372 | Date de conversație generală daneză | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 311, Bărbat: 417, Necunoscut: 0 | Contact | |
Chineză tradițională_SM_48 | Chineză Tradițională | Chineză Tradițională | zh-TW | 48 kHz | Monolog scenariu | 1,028 | Chineză Tradițională | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1069 Bărbat 262 Necunoscut 3 | Contact | |
Chineză simplificată_SM_48 | Chineza simplificată | Chineza simplificată | zh-CN | 48 kHz | Monolog scenariu | 2,762 | Chineza simplificată | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1920 Bărbat 1535 Necunoscut 270 | Contact | |
Chinese_MA_16 | Engleză chineză | Engleză chineză | ro_ | 16 kHz | Media Audio | 249 | Date audio media chinezești | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 126, Bărbat: 346 și Necunoscut: 6 | Contact | |
Chinese_CC_8 | Engleză chineză | Engleză chineză | ro_ | 8 kHz | Call center | 169 | Datele call-centerului chinezesc | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 1790, Bărbat: 523 și Necunoscut: 13 | Contact | |
Canadian_SM_48 | Franceză canadiană | Franceză canadiană | fr-CA | 48 kHz | Monolog scenariu | 1,222 | Franceză canadiană | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 974 Bărbat 631 Necunoscut 1 | Contact | |
Boston_MA_16 | Boston engleză | Boston engleză | ro_ | 16 kHz | Media Audio | 93 | Date audio Boston Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 43, Bărbat: 181 și Necunoscut: 2 | Contact | |
Boston_GC_8 | Boston engleză | Boston engleză | ro_ | 8 kHz | Conversație generală | 32 | Date despre conversația generală din Boston | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 53, Bărbat: 83 și Necunoscut: 0 | Contact | |
Engleză Deep South_GC_8 | Sudul Adanc englezesc | Sudul Adanc englezesc | ro_ | 8 kHz | Conversație generală | 56 | Engleză Deep South General Conversation date | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 99, Bărbat 31, Necunoscut 0 | Contact | |
Bengali_MA | bengaleză | bengaleză (în conductă) | bn_IN | Media Audio | 40 | Bengali (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Bengali_GC | bengaleză | bengaleză (în conductă) | bn_IN | Conversație generală | 100 | Bengali (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Bengali_CC_8 | bengaleză | bengaleză (în conductă) | bn_IN | Call center | 60 | Datele call-centerului în bengaleză (în conductă). | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Assamese_MA | Assameză | Asamez (În conductă) | ca în | Media Audio | 40 | Assamese (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Assamese_GC | Assameză | Asamez (În conductă) | ca în | Conversație generală | 100 | Assamese (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Assamese_CC_8 | Assameză | Asamez (În conductă) | ca în | Call center | 60 | Date din Assamese (In Pipeline) Call Center | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Arabic_SM_48 | Arabă | Arabă | ar-SA | 48 kHz | Monolog scenariu | 1,947 | Monolog cu scenarii arabe | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 838 Bărbat 1209 Necunoscut 78 | Contact | |
arabă_GC_8 | Arabă | Arabă | ar_AE | 8 kHz | Conversație generală | 292 | Date despre conversația generală arabă | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, arabă din țările din Golf | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 171, Bărbat: 534 și Necunoscut: 1 | Contact | |
Afrikaans_MA_16 | afrikaans | afrikaans | af_ZA | 16 kHz | Media Audio | 658 | Fișiere media africane | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 750, Bărbat: 1278 și Necunoscut: 52 | Contact | |
Afrikaans_GC_8 | afrikaans | afrikaans | af_ZA | 8 kHz | Conversație generală | 368 | Date despre conversația generală africană | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, limba afrikaans vorbită în Africa | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 502, Bărbat: 390 și Necunoscut: 2 | Contact | |
ro_US_MA_16 | Vernacular afro-american | Vernacular afro-american | ro_ | 16 kHz | Media Audio | 154 | Date despre mediile vernaculare afro-americane | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 151, Bărbat: 150 și Necunoscut: 10 | Contact | |
HINGLISH_MA_16 | hinglish | hinglish | hg_IN | 16 kHz | Media Audio | 216 | HINGLISH Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 75, Bărbat 380, Necunoscut 0 | Contact | |
coreeană_MA_16 | Coreeană | Coreeană | ko_KR | 16 kHz | Media Audio | 204 | Date audio media coreene | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 70 Bărbat 303, Necunoscut 25 | Contact | |
coreeană_CC_8 | Coreeană | Coreeană | ko_KR | 8 kHz | Call center | 107 | Datele centrului de apeluri coreeane | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1086, Bărbat 210, Necunoscut 4 | Contact | |
Kannada_MA | kannada | Kannada (În conductă) | kn_IN | Media Audio | 40 | Kannada (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Kannada_GC | kannada | Kannada (În conductă) | kn_IN | Conversație generală | 100 | Kannada (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Kannada_CC_8 | kannada | Kannada (În conductă) | kn_IN | Call center | 60 | Datele din centrul de apeluri Kannada (In Pipeline). | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Japanese_SM_48 | Japonez | Japonez | ja-JP | 48 kHz | Monolog scenariu | 2,335 | Monolog cu scenariu japonez | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1460 Bărbat 1221 Necunoscut 194 | Contact | |
Irish_GC_8 | irlandez | irlandez | ro_IE | 8 kHz | Conversație generală | 192 | Date despre conversația generală irlandeză | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 213 , Bărbat 153 , Necunoscut 0 | Contact | |
Indonesian_MA_16 | Indoneziană | Indoneziană | am facut | 16 kHz | Media Audio | 643 | Date audio media indoneziene | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 746, Bărbat 1507, Necunoscut 129 | Contact | |
Indonesian_GC_8 | Indoneziană | Indoneziană | am facut | 8 kHz | Conversație generală | 496 | Date despre conversația generală indoneziană | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, indoneziană Bahasa | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 524, Bărbat 454, Necunoscut 2 | Contact | |
Hispanic_MA_16 | engleza hispanica | engleza hispanica | ro_ | 16 kHz | Media Audio | 155 | Audio media hispanic Call Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 140, Bărbat 219, Necunoscut 5 | Contact | |
Hispanic_CC_8 | engleza hispanica | engleza hispanica | ro_ | 8 kHz | Call center | 212 | Date de la call-center hispanic | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 822, Bărbat 1262, Necunoscut 0 | Contact | |
ro_US_CC_8 | Vernacular afro-american | Vernacular afro-american | ro_ | 8 kHz | Call-center | 211 | Datele centrului de apeluri vernaculare afro-americane | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie: 612, Bărbat: 1242 și Necunoscut: 12 | Contact | |
HINGLISH_CC_8 | hinglish | hinglish | hg_IN | 8 kHz | Call center | 208 | HINGLISH Datele centrului de apeluri | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 822, Bărbat 1262, Necunoscut 0 | Contact | |
Hindi_SM_48 | hindi | hindi | salut | 48 kHz | Monolog scenariu | 2,867 | Monolog cu scenariu hindi | Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde | Mono | Mobile App | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 1977 Bărbat 1864 Necunoscut 147 | Contact | |
Hindi_MA_16 | hindi | hindi | salut_IN | 16 kHz | Media Audio | 219 | Date audio Hindi Media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 83, Bărbat 309, Necunoscut 0 | Contact | |
ebraică_MA_16 | ebraică | ebraică | el_IL | 16 kHz | Media Audio | 427 | Date audio media ebraică | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 361, Bărbat 513, Necunoscut 13 | Contact | |
Ebraică_Conversație generală_8 | ebraică | ebraică | el_IL | 8 kHz | Conversație generală | 399 | Date despre conversația generală ebraică | Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, ebraică în Israel | Dual | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 414 , Bărbat 399 , Necunoscut 1 | Contact | |
Gujarati_MA | Gujarati | Gujarati (În conductă) | gu_IN | Media Audio | 40 | Gujarati (In Pipeline) Date audio media | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Gujarati_GC | Gujarati | Gujarati (În conductă) | gu_IN | Conversație generală | 100 | Gujarati (In Pipeline) Date generale de conversație | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
Gujarati_CC_8 | Gujarati | Gujarati (În conductă) | gu_IN | Call center | 60 | Datele call-centerului din Gujarati (în conductă). | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Desktop | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Contact | ||||
German_IVR_8 | Germană | Germană | de-De | 8 kHz | IVR | 200 | Date IVR germane | De la om la mașină. Un tip de flux IVR în care există un prompt TTS (de exemplu „Cum vă pot ajuta”) urmat de un răspuns uman spontan | Mono | Desktop | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 10115 Barbat 8750 Necunoscut 0 | Contact | ||
German_CC_8 | Germană | Germană | de-De | 8 kHz | Call center | 64 | Date germane ale centrului de apeluri | Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, | Mono | Desktop | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 478 Barbat 1440 Necunoscut 0 | Contact | ||
Engleză Deep South_MA_16 | Sudul Adanc englezesc | Sudul Adanc englezesc | ro_ | 16 kHz | Media Audio | 266 | Engleză Deep South Media date audio | Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute | Mono | Web Sourcing | 5.0 | .wav | .json | ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică | Femeie 204, Bărbat 356, Necunoscut 21 | Contact |
Servicii oferite
Colectarea expertă a datelor audio nu este completă pentru setări AI complete. La Shaip, puteți chiar să luați în considerare următoarele servicii pentru a face modelele mult mai răspândite decât de obicei:
Colectarea datelor text
servicii
Adevărata valoare a serviciilor de colectare a datelor cognitive Shaip este că oferă organizațiilor cheia pentru a debloca informațiile critice găsite în datele nestructurate.
Servicii de colectare a datelor de imagine
Asigurați-vă că modelul dvs. de viziune computerizată identifică fiecare imagine cu acuratețe, pentru a antrena fără probleme modelele AI de nouă generație ale viitorului
Servicii de colectare a datelor video
Acum concentrați-vă pe viziunea computerizată împreună cu NLP pentru a vă antrena modelele pentru a identifica obiectele, indivizii, elementele de descurajare și alte elemente vizuale la perfecțiune
Resurse recomandate
Oferind
Adnotare audio pentru AI inteligente
Serviciile de adnotare audio au fost un punct forte al Shaip încă de la început. Dezvoltați, antrenați și îmbunătățiți IA conversațională, chatbot și motoare de recunoaștere a vorbirii cu serviciile noastre de ultimă generație de adnotare audio.
Ghidul cumpărătorului
Ghidul cumpărătorului: Ghid complet pentru IA conversațională
Chatbot-ul cu care ați conversat rulează pe un sistem AI conversațional avansat, care este antrenat, testat și construit folosind tone de seturi de date de recunoaștere a vorbirii.
Catalog de date
Catalog de date despre vorbire de la raft și licențiere
Există o mare varietate de aplicații comune pentru datele de vorbire în proiectele AI. Vă oferim cantități mari de date de înaltă calitate pregătite pentru recunoașterea vocii.
Doriți să vă construiți propriul set de date audio?
Conectați-vă cu expertul nostru intern în colectarea datelor despre vorbire pentru a configura un depozit audio care se potrivește cel mai bine cerințelor dvs
Întrebări frecvente (FAQ)
Colectarea datelor de vorbire pentru un model ML se referă la procesul de colectare a înregistrărilor audio ale limbajului vorbit. Această colecție ajută la formarea și perfecționarea algoritmilor de învățare automată, în special a celor centrați pe înțelegerea și procesarea vocilor umane.
Când doriți să colectați date audio pentru recunoașterea automată a vorbirii (ASR), ar trebui să începeți prin a defini nevoile specifice ale proiectului, inclusiv limba dorită, accentul și tipul de vorbire. După setarea acestor parametri, asigurați-vă că obțineți toate permisiunile necesare pentru a respecta confidențialitatea utilizatorului. Apoi, utilizați dispozitive de înregistrare sau software adecvate pentru a captura mostre audio clare. Fiecare înregistrare ar trebui să fie adnotată meticulos cu transcrierea sau alte metadate pertinente și stocată sistematic pentru acces fără efort.
Un set de date de vorbire în învățarea automată este esențial pentru formarea, testarea și validarea modelelor adaptate pentru a recunoaște, transcrie sau interpreta limbajul vorbit. Astfel de seturi de date deschid calea pentru o multitudine de aplicații, de la asistenți vocali și servicii de transcriere până la biometrie vocală.
Pentru a colecta date precise din diverse limbi și accente, este vitală colaborarea cu vorbitori nativi din mediul lingvistic dorit. Urmăriți un eșantion variat și reprezentativ pentru a acoperi un spectru larg de nuanțe demografice. Folosiți echipamente de înregistrare standardizate în medii uniforme pentru a asigura consistența audio. Și, important, adnotă fiecare bucată de date cu transcripții și metadate detaliate, indicând limba și accentul specific.