Cele mai de încredere servicii de colectare a datelor despre vorbire pentru IA dvs

Antrenați-vă modelele NLP, VA, prototipurile TTS și multe altele cu date conversaționale de calitate, cu serviciile noastre de colectare a datelor audio și de vorbire

Audio data collection

Descoperiți conducte de date audio fără blocaje

Clienți prezentați

Servicii profesionale de colectare a datelor audio/voce

Orice subiect. Orice scenariu.

La Shaip, expertiza noastră constă în crearea de seturi de date de vorbire de înaltă calitate, concepute pentru cerințe variate AI/ML. Oferim o gamă extinsă de limbi și înregistrăm în diverse setări, făcând seturile noastre de date cuprinzătoare și adaptabile. Oaccentul se pune pe furnizarea de modele cu cel mai mare volum de date de vorbire personalizate, în cel mai mic timp posibil. Cu noi la bord, vă puteți aștepta la: 

Culegere de vorbire
  • Date audio/voce multilingve de înaltă calitate pentru a îmbunătăți acuratețea
  • Cel mai înalt nivel posibil de specificitate a domeniului pentru target scenariu divers configurarea
  •  Scalați-vă modelul ML pentru a se potrivi cu diverse categorii demografice și verticale
  • Medii de înregistrare: Calitate studio, oferind un sunet clar, cu zgomot de fundal minim și Mediile naturale, unde înregistrările încorporează sunete ambientale pentru a imita situațiile din lumea reală.

100+

Țări

55K +

Date despre orele de vorbire

250+

Proiecte

60+

Limbi (100+ dialecte)

8 / 16 / 44 / 48 kHz

Rata de eșantionare

Expertiza noastră

Aliniați datele audio la pentru modele NLP mai inteligente

Shaip oferă servicii de colectare de date de vorbire/audio de la capăt la capăt în peste 100 de limbi pentru a permite tehnologiilor activate de voce să răspundă unui set divers de public de pe tot globul. Putem lucra la proiecte de orice anvergură și dimensiune; de la acordarea de licențe a seturilor de date audio existente, până la gestionarea colecției de date audio personalizate, la transcrierea și adnotarea audio. Indiferent cât de mare este proiectul dvs. de colectare a datelor despre vorbire, putem personaliza serviciile de colectare audio pentru a se potrivi nevoilor dvs. pentru a construi seturi de date NLP de înaltă calitate care vizează dialectele, tonurile și limbile. Alegeți din gama noastră largă de seturi de date despre vorbire și resurse de colectare a datelor audio, pentru setări inteligente care permit vocea.

Monologue speech

Colecția de discursuri monolog

Se concentrează pe procesarea vorbirii de la un singur vorbitor. Utilizați instrucțiuni scriptate pentru a alimenta fișiere audio cu un singur canal, asigurând capturarea de modele de vorbire, tonuri și nuanțe unice specifice individului respectiv.

Dialogue speech

Discurs de dialog
Colectie

Interacțiunea a două persoane, reproducând conversațiile și dialogurile din lumea reală cu expunere multilingvă prin fișiere cu două canale și resurse transcrise.

Multi-party conversations

Grup / Muti-party
conversaţii

Discuții cu mai multe persoane, captarea dinamicii grupului, suprapuneri și tonuri variate, astfel încât să antreneze cu precizie modelele de vorbire.

Natural language utterance

Colecția de expresii în limbaj natural

Antrenați AI-urile pentru a identifica fraze sau cuvinte de trezire cu semnificații similare folosind enunțuri diverse, bogate și autentice pentru procesarea și înțelegerea avansată a limbajului natural.

Acoustic speech

Date acustice
Colectie

Putem înregistra profesional date audio la calitate de studio, fie că este vorba de restaurante, birouri sau case sau din diverse medii și limbi, acoperind în același timp o gamă acustică mai largă (Seturi de date complete de sunet).

Recunoașterea automată a vorbirii

Recunoaștere automată a vorbirii (ASR)

Îmbunătățiți acuratețea sistemelor dvs. de recunoaștere automată a vorbirii (ASR) având acces la seturi de date audio/vorbire diversificate de ultimă generație, dintr-o gamă largă de date demografice.

Natural language utterance

Date de antrenament audio/vorbire multilingve

Profesioniștii noștri calificați în limbi străine din întreaga lume oferă date audio/vorbire multilingve în diferite limbi și dialecte. Acest efort încurajează comunicarea globală și depășește barierele lingvistice, contribuind la soluții AI mai incluzive și mai eficiente.

Digital virtual assistants

Text-to-Speech
(TTS)

Construiți un model multilingv de text-to-speech (TTS) cu ajutorul forței noastre de muncă globale, care vă ajută să colectați date de vorbire în peste 150 de limbi și dialecte pentru a vă îmbunătăți modelele AI, de la comenzile din mașină la chatbot și soluții de învățare cu date audio de calitate.

Call center recordings

Call Center
înregistrări

Schimburi autentice între agenți și clienți, care acceptă numeroase limbi precum spaniolă, germană, engleză americană, bengaleză, japoneză, chineză și hindi.

Povești de succes

Seturi de date AI conversaționale cu peste 3 de ore de date în 8 limbi

În căutarea de a construi o platformă multilingvă pentru limbile indiene, clientul a colaborat cu Shaip pentru a colecta, segmenta și transcrie seturi mari de date în mai multe limbi indiene. Acest lucru ar ajuta la dezvoltarea modelelor de vorbire eficiente care ar putea alimenta noua platformă inovatoare a clientului.

Problemă: Peste 3,000 de ore de date audio colectate în 8 limbi indiene, segmentate și transcrise pentru a dezvolta recunoașterea automată a vorbirii.

Soluţie: Am furnizat colectarea datelor, segmentarea, transcrierea și livrat fișiere JSON cu metadate. Am colectat 3000 de ore de date audio în 8 limbi indiene la scară pentru proiectul de tehnologie de vorbire al clientului.

Speech data collection case study

Motive pentru a alege Shaip ca partener de încredere pentru colectarea datelor despre vorbire

oameni

oameni

Echipe dedicate și pregătite:

  • Peste 30,000 de colaboratori pentru crearea datelor, etichetare și asigurare a calității
  • Echipa de management de proiect acreditată
  • Echipa de dezvoltare a produselor cu experiență
  • Echipa Talent Pool Sourcing & Onboarding
Proces

Proces

Cea mai mare eficiență a procesului este asigurată cu:

  • Proces robust 6 Sigma Stage-Gate
  • O echipă dedicată de centuri negre 6 Sigma – proprietari cheie de proces și conformitate cu calitatea
  • Îmbunătățire continuă și buclă de feedback
Platformă

Platformă

Platforma patentata ofera beneficii:

  • Platformă end-to-end bazată pe web
  • Calitate impecabilă
  • TAT mai rapid
  • Livrare fără întreruperi

Seturi de date pentru vorbire/audio disponibile

DetaliiSet de date de limbăRata simplaTipul setului de dateNumărul total de ore audioDescriere pe scurtDescrierea setului de dateCanal audioPlatformă de înregistrareNOI SUNTEM (%)Format audioFormat de transcriereUtilizare cazNumăr de vorbitoriCTA
Vorbirero_US_CC_8Vernacular afro-americanVernacular afro-americanro_8 kHzCall-center211Datele centrului de apeluri vernaculare afro-americaneConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 612, Bărbat: 1242 și Necunoscut: 12
Vorbirero_US_MA_16Vernacular afro-americanVernacular afro-americanro_16 kHzMedia Audio154Date despre mediile vernaculare afro-americaneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 151, Bărbat: 150 și Necunoscut: 10
VorbireAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzConversație generală368Date despre conversația generală africanăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, limba afrikaans vorbită în AfricaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 502, Bărbat: 390 și Necunoscut: 2
VorbireAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658Fișiere media africaneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 750, Bărbat: 1278 și Necunoscut: 52
Vorbirearabă_GC_8ArabăArabăar_AE8 kHzConversație generală292Date despre conversația generală arabăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, arabă din țările din GolfDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 171, Bărbat: 534 și Necunoscut: 1
VorbireArabic_SM_48ArabăArabăar-SA48 kHzMonolog scenariu1,947Monolog cu scenarii arabeÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 838 Bărbat 1209 Necunoscut 78
VorbireAssamese_CC_8AssamezăAsamez (În conductă) ca înCall center60Date din Assamese (In Pipeline) Call CenterConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireAssamese_GCAssamezăAsamez (În conductă) ca înConversație generală100Assamese (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireAssamese_MAAssamezăAsamez (În conductă) ca înMedia Audio40Assamese (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_CC_8bengalezăbengaleză (în conductă) bn_INCall center60Datele call-centerului în bengaleză (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_GCbengalezăbengaleză (în conductă) bn_INConversație generală100Bengali (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_MAbengalezăbengaleză (în conductă) bn_INMedia Audio40Bengali (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBoston_CC_8Boston englezăBoston englezăro_8 kHzCall center177Datele din centrul de apeluri din BostonConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 605, Bărbat: 711 și Necunoscut: 0
VorbireBoston_GC_8Boston englezăBoston englezăro_8 kHzConversație generală32Date despre conversația generală din BostonConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 53, Bărbat: 83 și Necunoscut: 0
VorbireBoston_MA_16Boston englezăBoston englezăro_16 kHzMedia Audio93Date audio Boston MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 43, Bărbat: 181 și Necunoscut: 2
VorbireCanadian_SM_48Franceză canadianăFranceză canadianăfr-CA48 kHzMonolog scenariu1,222Franceză canadianăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 974 Bărbat 631 Necunoscut 1
VorbireChinese_CC_8Engleză chinezăEngleză chinezăro_8 kHzCall center169Datele call-centerului chinezescConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 1790, Bărbat: 523 și Necunoscut: 13
VorbireChinese_MA_16Engleză chinezăEngleză chinezăro_16 kHzMedia Audio249Date audio media chinezeștiFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 126, Bărbat: 346 și Necunoscut: 6
VorbireChineză simplificată_SM_48Chineza simplificatăChineza simplificatăzh-CN48 kHzMonolog scenariu2,762Chineza simplificatăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1920 Bărbat 1535 Necunoscut 270
VorbireChineză tradițională_SM_48Chineză TradiționalăChineză Tradiționalăzh-TW48 kHzMonolog scenariu1,028Chineză TradiționalăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1069 Bărbat 262 Necunoscut 3
VorbireDanish_GC_8danezădanezăda_DK8 kHzConversație generală372Date de conversație generală danezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 311, Bărbat: 417, Necunoscut: 0
Vorbiredanez_MA_16danezădanezăda_DK16 kHzMedia Audio664Date audio Danish MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 369, Bărbat: 864, Necunoscut: 27
VorbireDanish_SM_48danezădanezăda-DK48 kHzMonolog scenariu2,579Monolog cu scenariu danezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde, daneză din DanemarcaMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1551 Bărbat 1233 Necunoscut 42
VorbireEngleză Deep South_CC_8Sudul Adanc englezescSudul Adanc englezescro_8 kHzCall center151Engleză Deep South Call-center de dateConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 221 , Bărbat 1004 , Necunoscut 7
VorbireEngleză Deep South_GC_8Sudul Adanc englezescSudul Adanc englezescro_8 kHzConversație generală56Engleză Deep South General Conversation dateConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 99, Bărbat 31, Necunoscut 0
VorbireEngleză Deep South_MA_16Sudul Adanc englezescSudul Adanc englezescro_16 kHzMedia Audio266Engleză Deep South Media date audioFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 204, Bărbat 356, Necunoscut 21
VorbireGerman_CC_8GermanăGermanăde-De8 kHzCall center64Date germane ale centrului de apeluri Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,MonoDesktop.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 478 Barbat 1440 Necunoscut 0
VorbireGerman_IVR_8GermanăGermanăde-De8 kHz IVR200Date IVR germaneDe la om la mașină. Un tip de flux IVR în care există un prompt TTS (de exemplu „Cum vă pot ajuta”) urmat de un răspuns uman spontanMonoDesktop.wav .jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică Femeie 10115 Barbat 8750 Necunoscut 0
VorbireGujarati_CC_8GujaratiGujarati (În conductă) gu_INCall center60Datele call-centerului din Gujarati (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireGujarati_GCGujaratiGujarati (În conductă) gu_INConversație generală100Gujarati (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireGujarati_MAGujaratiGujarati (În conductă) gu_INMedia Audio40Gujarati (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireEbraică_Conversație generală_8ebraicăebraicăel_IL8 kHzConversație generală399Date despre conversația generală ebraicăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, ebraică în IsraelDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 414 , Bărbat 399 , Necunoscut 1
Vorbireebraică_MA_16ebraicăebraicăel_IL16 kHzMedia Audio427Date audio media ebraicăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 361, Bărbat 513, Necunoscut 13
VorbireHindi_MA_16hindihindisalut_IN16 kHzMedia Audio219Date audio Hindi MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 83, Bărbat 309, Necunoscut 0
VorbireHindi_SM_48hindihindisalut48 kHzMonolog scenariu2,867Monolog cu scenariu hindiÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1977 Bărbat 1864 Necunoscut 147
VorbireHINGLISH_CC_8hinglishhinglishhg_IN8 kHzCall center208HINGLISH Datele centrului de apeluriConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 822, Bărbat 1262, Necunoscut 0
VorbireHINGLISH_MA_16hinglishhinglishhg_IN16 kHzMedia Audio216HINGLISH Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 75, Bărbat 380, Necunoscut 0
VorbireHispanic_CC_8engleza hispanicaengleza hispanicaro_8 kHzCall center212Date de la call-center hispanicConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 822, Bărbat 1262, Necunoscut 0
VorbireHispanic_MA_16engleza hispanicaengleza hispanicaro_16 kHzMedia Audio155Audio media hispanic Call MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 140, Bărbat 219, Necunoscut 5
VorbireIndonesian_GC_8IndonezianăIndonezianăam facut8 kHzConversație generală496Date despre conversația generală indonezianăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, indoneziană BahasaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 524, Bărbat 454, Necunoscut 2
VorbireIndonesian_MA_16IndonezianăIndonezianăam facut16 kHzMedia Audio643Date audio media indonezieneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 746, Bărbat 1507, Necunoscut 129
VorbireIrish_GC_8irlandezirlandezro_IE8 kHzConversație generală192Date despre conversația generală irlandezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 213 , Bărbat 153 , Necunoscut 0
VorbireJapanese_SM_48JaponezJaponezja-JP48 kHzMonolog scenariu2,335Monolog cu scenariu japonezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1460 Bărbat 1221 Necunoscut 194
VorbireKannada_CC_8kannadaKannada (În conductă) kn_INCall center60Datele din centrul de apeluri Kannada (In Pipeline).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireKannada_GCkannadaKannada (În conductă) kn_INConversație generală100Kannada (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireKannada_MAkannadaKannada (În conductă) kn_INMedia Audio40Kannada (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Vorbirecoreeană_CC_8CoreeanăCoreeanăko_KR8 kHzCall center107Datele centrului de apeluri coreeaneConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1086, Bărbat 210, Necunoscut 4
Vorbirecoreeană_MA_16CoreeanăCoreeanăko_KR16 kHzMedia Audio204Date audio media coreeneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 70 Bărbat 303, Necunoscut 25
VorbireKorean_SM_48CoreeanăCoreeanăko-KR48 kHzMonolog scenariu1,955Monolog cu scenariu coreeanÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1195 Bărbat 1134 Necunoscut 122
VorbireMalay_GC_8malaezianmalaezianms_MY8 kHzConversație generală266Date despre conversația generală malaezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, malay în MalaeziaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 316, Bărbat 176, Necunoscut 0
VorbireMalay_MA_16malaezianmalaezianms_MY16 kHzMedia Audio344Date audio Malay MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 236, Bărbat 626, Necunoscut 47
VorbireMalayalam_CC_8malayalamMalayalam (În conductă) ml_INCall center60Malayalam (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMalayalam_GCmalayalamMalayalam (În conductă) ml_INConversație generală100Malayalam (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMalayalam_MAmalayalamMalayalam (În conductă) ml_INMedia Audio40Malayalam (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_CC_8marathiMarathi (În conductă) mr_INCall center60Date de la Call-Center Marathi (In Pipeline).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_GCmarathiMarathi (În conductă) mr_INConversație generală100Marathi (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_MAmarathiMarathi (În conductă) mr_INMedia Audio40Marathi (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMexican_SM_48Spaniolă (Mexic)Spaniolă (Mexic)ro-MX48 kHzMonolog scenariu1,492Monolog cu scenariu mexican spaniolÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1016 Bărbat 1069 Necunoscut 95
VorbireOlanda_SM_48OlandezăOlandezănl-NL48 kHzMonolog scenariu1,205Monolog cu scenariu olandezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1285 Bărbat 531 Necunoscut 3
VorbireNew York English_CC_8New York englezăNew York englezăro_8 kHzCall center103New York English Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 610, Bărbat 532, Necunoscut 0
VorbireNew York English_GC_8New York englezăNew York englezăro_8 kHzConversație generală107Date despre conversația generală în limba engleză din New YorkConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 118, Bărbat 114, Necunoscut 0
VorbireNew York English_MA_16New York englezăNew York englezăro_16 kHzMedia Audio140Date audio New York English MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 66, Bărbat 230, Necunoscut 11
VorbireNoua Zeelandă_GC_8engleză din Noua Zeelandă engleză din Noua Zeelandă ro_NZ8 kHzConversație generală148Date de conversație generală în limba engleză din Noua ZeelandăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 167, bărbat 121, Necunoscut 4
VorbireNoua Zeelandă_MA_16engleză din Noua Zeelandă engleză din Noua Zeelandă ro_NZ16 kHzMedia Audio400Audio media engleză din Noua ZeelandăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 367, bărbat 678, Necunoscut 26
VorbireOriya_CC_8oriyaOriya (În conductă) sau_INCall center60Oriya (In Pipeline) Datele Call CenterConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireOriya_GCoriyaOriya (În conductă) sau_INConversație generală100Oriya (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireOriya_MAoriyaOriya (În conductă) sau_INMedia Audio40Oriya (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Vorbirepoloneză_MA_16PolonezăPolonezăpl_PL16 kHzMedia Audio269Audio media polonezăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 173 Bărbat 354 Necunoscut 6
Vorbirepoloneză Polonia_SM_48Poloneză (Polonia)Poloneză (Polonia)pl-pl48 kHzMonolog scenariu1,482Polonia poloneză - Monolog scenariuÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1324 Bărbat 701 Necunoscut 24
VorbirePunjabi_CC_8PunjabiPunjabi (În conductă) PunjabiCall center60Punjabi (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbirePunjabi_GCPunjabiPunjabi (În conductă) PunjabiConversație generală100Punjabi (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbirePunjabi_MAPunjabiPunjabi (În conductă) Punjabi Media Audio40Punjabi (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireRussian_SM_48RusăRusăru-ru48 kHzMonolog scenariu2,398Monolog cu scenariu rusescÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1689 Bărbat 1937 Necunoscut 214
VorbireScottish_GC_8scoțian (accent englezesc)scoțian (accent englezesc)ro_AB8 kHzConversație generală292Date despre conversația generală din ScoțiaConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 285, Bărbat 260, Necunoscut 3
VorbireSingapore_CC_8Singapore englezăSingapore englezăro_SG8 kHzCall center218Date din centrul de apeluri din SingaporeConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 2139, Bărbat 884, Necunoscut 21
VorbireSingapore_MA_16Singapore englezăSingapore englezăro_SG16 kHzMedia Audio247Date audio Singapore MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 160, Bărbat 455, Necunoscut 37
Vorbireengleză sud-africană_CC_8engleză sud-africanăengleză sud-africanăro_ZA8 kHzCall center261Datele centrului de apel în engleză din Africa de SudConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1274 , Bărbat 935 , Necunoscut 1
Vorbireengleză sud-africană_MA_16engleză sud-africanăengleză sud-africanăro_ZA16 kHzMedia Audio251Date audio media engleză din Africa de SudFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 235, Bărbat 432, Necunoscut 36
VorbireSwahili_CC_8SwahiliSwahilisw_KE8 kHzCall center230Datele call-centerului swahiliConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 611, Bărbat 833, Necunoscut 0
VorbireSwahili_MA_16SwahiliSwahilisw_KE16 kHzMedia Audio265Date audio Swahili MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 118, Bărbat 493, Necunoscut 25
Vorbiresuedeză_CC_8SuedezăSuedezăsv_SE8 kHzCall center250Datele call-centerului suedezConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1581, bărbat 727, Necunoscut 2
Vorbiresuedeză_MA_16SuedezăSuedezăsv_SE16 kHzMedia Audio278Date audio media suedezăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 195, bărbat 500, Necunoscut 21
VorbireTamil_CC_8tamilTamil (În conductă) ta_INCall center60Date din call-center tamil (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTamil_GCtamilTamil (În conductă) ta_INConversație generală100Tamil (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTamil_MAtamil Tamil (În conductă) ta_INMedia Audio40Tamil (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_GC_8telugutelugute_IN8 kHzConversație generală553Telugu General Conversation dateConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 574, Bărbat 564, Necunoscut 0
VorbireTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Date audio Telugu MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 207, Bărbat 963, Necunoscut 2
VorbireTelugu_CC_8teluguTelugu (În conductă) te_INCall center30Telugu (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_GCteluguTelugu (În conductă) te_INConversație generală50Telugu (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_MAteluguTelugu (În conductă) te_INMedia Audio20Telugu (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireThai_GC_8ThailandezăThailandezăth_TH8 kHzConversație generală183Conversație generală thailandezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, un registru informal folosit între prieteniDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 338, Bărbat 96, Necunoscut 8
VorbireThai_MA_8ThailandezăThailandezăth_TH16 kHzMedia Audio173Audio media thailandezFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 143, Bărbat 502, Necunoscut 26
VorbireTurcia Turcia_SM_48Turcia turceascăTurcia turceascătr-TR48 kHzMonolog scenariu2,027Turcia turceascăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1561 Bărbat 1241 Necunoscut 31
Vorbirevietnameză_GC_8VietnamezăVietnamezăvi_VN8 kHzConversație generală295Date de conversație generală vietnamezăConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, nord (de exemplu, Hanoi), centru și sud (de exemplu, orașul Ho Chi Minh).DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 400, bărbat 380, Necunoscute 2
Vorbirevietnameză_MA_16VietnamezăVietnamezăvi_VN16 kHzMedia Audio257Date audio media vietnamezeFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 249, bărbat 200, Necunoscute 45
VorbireWelsh_GC_8Welsh (accent englezesc)Welsh (accent englezesc)ro_WL8 kHzConversație generală278Date despre conversația generală galezăConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 270, Bărbat 324, Necunoscut 0
VorbireUK English_WW_16Marea BritanieMarea Britaniero_uk16 kHzWake WordDifuzoarele 200Wake Word engleză britanicăfraze cheie colectare de date
  • boxe 200
  • 4 fraze cheie unice pentru fiecare difuzor
  • 25-30 de înregistrări repetate de fraze cheie pentru fiecare frază cheie unică
  • 25-30 de fișiere audio pentru fiecare frază cheie unică
  • 120 total de enunțuri înregistrate pentru fiecare vorbitor
canal 1Mobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăSex: 50% bărbați, 50% femei, +/- 10%.

Servicii oferite

Colectarea expertă a datelor audio nu este completă pentru setări AI complete. La Shaip, puteți chiar să luați în considerare următoarele servicii pentru a face modelele mult mai răspândite decât de obicei:

Colectarea datelor text

Colectarea datelor text
Servicii

Adevărata valoare a serviciilor de colectare a datelor cognitive Shaip este că oferă organizațiilor cheia pentru a debloca informațiile critice găsite în datele nestructurate.

Colectarea datelor de imagine

Servicii de colectare a datelor de imagine

Asigurați-vă că modelul dvs. de viziune computerizată identifică fiecare imagine cu acuratețe, pentru a antrena fără probleme modelele AI de nouă generație ale viitorului

Colectarea datelor video

Servicii de colectare a datelor video

Acum concentrați-vă pe viziunea computerizată împreună cu NLP pentru a vă antrena modelele pentru a identifica obiectele, indivizii, elementele de descurajare și alte elemente vizuale la perfecțiune

Shaip contactați-ne

Doriți să vă construiți propriul set de date audio?

Conectați-vă cu expertul nostru intern în colectarea datelor despre vorbire pentru a configura un depozit audio care se potrivește cel mai bine cerințelor dvs

  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.

Colectarea datelor de vorbire pentru un model ML se referă la procesul de colectare a înregistrărilor audio ale limbajului vorbit. Această colecție ajută la formarea și perfecționarea algoritmilor de învățare automată, în special a celor centrați pe înțelegerea și procesarea vocilor umane.

Când doriți să colectați date audio pentru recunoașterea automată a vorbirii (ASR), ar trebui să începeți prin a defini nevoile specifice ale proiectului, inclusiv limba dorită, accentul și tipul de vorbire. După setarea acestor parametri, asigurați-vă că obțineți toate permisiunile necesare pentru a respecta confidențialitatea utilizatorului. Apoi, utilizați dispozitive de înregistrare sau software adecvate pentru a captura mostre audio clare. Fiecare înregistrare ar trebui să fie adnotată meticulos cu transcrierea sau alte metadate pertinente și stocată sistematic pentru acces fără efort.

Un set de date de vorbire în învățarea automată este esențial pentru formarea, testarea și validarea modelelor adaptate pentru a recunoaște, transcrie sau interpreta limbajul vorbit. Astfel de seturi de date deschid calea pentru o multitudine de aplicații, de la asistenți vocali și servicii de transcriere până la biometrie vocală.

Pentru a colecta date precise din diverse limbi și accente, este vitală colaborarea cu vorbitori nativi din mediul lingvistic dorit. Urmăriți un eșantion variat și reprezentativ pentru a acoperi un spectru larg de nuanțe demografice. Folosiți echipamente de înregistrare standardizate în medii uniforme pentru a asigura consistența audio. Și, important, adnotă fiecare bucată de date cu transcripții și metadate detaliate, indicând limba și accentul specific.