Seturi de date audio/voce/voce de înaltă calitate pentru a vă antrena modelul AI conversațional 

Seturi de date standard pentru voce/voce/audio în mai multe limbi pentru a porni modelele tale de recunoaștere automată a vorbirii (ASR)

Seturi de date de vorbire

Conectați catalogul de date audio pe care l-ați lipsit astăzi

DetaliiSet de date de limbăRata simplaTipul setului de dateNumărul total de ore audioDescriere pe scurtDescrierea setului de dateCanal audioPlatformă de înregistrareNOI SUNTEM (%)Format audioFormat de transcriereUtilizare cazNumăr de vorbitoriCTA
Vorbirero_US_CC_8Vernacular afro-americanVernacular afro-americanro_8 kHzCall-center211Datele centrului de apeluri vernaculare afro-americaneConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 612, Bărbat: 1242 și Necunoscut: 12
Vorbirero_US_MA_16Vernacular afro-americanVernacular afro-americanro_16 kHzMedia Audio154Date despre mediile vernaculare afro-americaneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 151, Bărbat: 150 și Necunoscut: 10
VorbireAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzConversație generală368Date despre conversația generală africanăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, limba afrikaans vorbită în AfricaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 502, Bărbat: 390 și Necunoscut: 2
VorbireAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzMedia Audio658Fișiere media africaneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 750, Bărbat: 1278 și Necunoscut: 52
Vorbirearabă_GC_8ArabăArabăar_AE8 kHzConversație generală292Date despre conversația generală arabăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, arabă din țările din GolfDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 171, Bărbat: 534 și Necunoscut: 1
VorbireArabic_SM_48ArabăArabăar-SA48 kHzMonolog scenariu1,947Monolog cu scenarii arabeÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 838 Bărbat 1209 Necunoscut 78
VorbireAssamese_CC_8AssamezăAsamez (În conductă) ca înCall center60Date din Assamese (In Pipeline) Call CenterConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireAssamese_GCAssamezăAsamez (În conductă) ca înConversație generală100Assamese (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireAssamese_MAAssamezăAsamez (În conductă) ca înMedia Audio40Assamese (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_CC_8bengalezăbengaleză (în conductă) bn_INCall center60Datele call-centerului în bengaleză (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_GCbengalezăbengaleză (în conductă) bn_INConversație generală100Bengali (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBengali_MAbengalezăbengaleză (în conductă) bn_INMedia Audio40Bengali (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireBoston_CC_8Boston englezăBoston englezăro_8 kHzCall center177Datele din centrul de apeluri din BostonConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 605, Bărbat: 711 și Necunoscut: 0
VorbireBoston_GC_8Boston englezăBoston englezăro_8 kHzConversație generală32Date despre conversația generală din BostonConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 53, Bărbat: 83 și Necunoscut: 0
VorbireBoston_MA_16Boston englezăBoston englezăro_16 kHzMedia Audio93Date audio Boston MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 43, Bărbat: 181 și Necunoscut: 2
VorbireCanadian_SM_48Franceză canadianăFranceză canadianăfr-CA48 kHzMonolog scenariu1,222Franceză canadianăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 974 Bărbat 631 Necunoscut 1
VorbireChinese_CC_8Engleză chinezăEngleză chinezăro_8 kHzCall center169Datele call-centerului chinezescConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 1790, Bărbat: 523 și Necunoscut: 13
VorbireChinese_MA_16Engleză chinezăEngleză chinezăro_16 kHzMedia Audio249Date audio media chinezeștiFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 126, Bărbat: 346 și Necunoscut: 6
VorbireChineză simplificată_SM_48Chineza simplificatăChineza simplificatăzh-CN48 kHzMonolog scenariu2,762Chineza simplificatăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1920 Bărbat 1535 Necunoscut 270
VorbireChineză tradițională_SM_48Chineză TradiționalăChineză Tradiționalăzh-TW48 kHzMonolog scenariu1,028Chineză TradiționalăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1069 Bărbat 262 Necunoscut 3
VorbireDanish_GC_8danezădanezăda_DK8 kHzConversație generală372Date de conversație generală danezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 311, Bărbat: 417, Necunoscut: 0
Vorbiredanez_MA_16danezădanezăda_DK16 kHzMedia Audio664Date audio Danish MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie: 369, Bărbat: 864, Necunoscut: 27
VorbireDanish_SM_48danezădanezăda-DK48 kHzMonolog scenariu2,579Monolog cu scenariu danezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde, daneză din DanemarcaMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1551 Bărbat 1233 Necunoscut 42
VorbireEngleză Deep South_CC_8Sudul Adanc englezescSudul Adanc englezescro_8 kHzCall center151Engleză Deep South Call-center de dateConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 221 , Bărbat 1004 , Necunoscut 7
VorbireEngleză Deep South_GC_8Sudul Adanc englezescSudul Adanc englezescro_8 kHzConversație generală56Engleză Deep South General Conversation dateConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 99, Bărbat 31, Necunoscut 0
VorbireEngleză Deep South_MA_16Sudul Adanc englezescSudul Adanc englezescro_16 kHzMedia Audio266Engleză Deep South Media date audioFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 204, Bărbat 356, Necunoscut 21
VorbireGerman_CC_8GermanăGermanăde-De8 kHzCall center64Date germane ale centrului de apeluri Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,MonoDesktop.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 478 Barbat 1440 Necunoscut 0
VorbireGerman_IVR_8GermanăGermanăde-De8 kHz IVR200Date IVR germaneDe la om la mașină. Un tip de flux IVR în care există un prompt TTS (de exemplu „Cum vă pot ajuta”) urmat de un răspuns uman spontanMonoDesktop.wav .jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică Femeie 10115 Barbat 8750 Necunoscut 0
VorbireGujarati_CC_8GujaratiGujarati (În conductă) gu_INCall center60Datele call-centerului din Gujarati (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireGujarati_GCGujaratiGujarati (În conductă) gu_INConversație generală100Gujarati (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireGujarati_MAGujaratiGujarati (În conductă) gu_INMedia Audio40Gujarati (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireEbraică_Conversație generală_8ebraicăebraicăel_IL8 kHzConversație generală399Date despre conversația generală ebraicăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, ebraică în IsraelDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 414 , Bărbat 399 , Necunoscut 1
Vorbireebraică_MA_16ebraicăebraicăel_IL16 kHzMedia Audio427Date audio media ebraicăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 361, Bărbat 513, Necunoscut 13
VorbireHindi_MA_16hindihindisalut_IN16 kHzMedia Audio219Date audio Hindi MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 83, Bărbat 309, Necunoscut 0
VorbireHindi_SM_48hindihindisalut48 kHzMonolog scenariu2,867Monolog cu scenariu hindiÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1977 Bărbat 1864 Necunoscut 147
VorbireHINGLISH_CC_8hinglishhinglishhg_IN8 kHzCall center208HINGLISH Datele centrului de apeluriConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 822, Bărbat 1262, Necunoscut 0
VorbireHINGLISH_MA_16hinglishhinglishhg_IN16 kHzMedia Audio216HINGLISH Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 75, Bărbat 380, Necunoscut 0
VorbireHispanic_CC_8engleza hispanicaengleza hispanicaro_8 kHzCall center212Date de la call-center hispanicConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 822, Bărbat 1262, Necunoscut 0
VorbireHispanic_MA_16engleza hispanicaengleza hispanicaro_16 kHzMedia Audio155Audio media hispanic Call MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 140, Bărbat 219, Necunoscut 5
VorbireIndonesian_GC_8IndonezianăIndonezianăam facut8 kHzConversație generală496Date despre conversația generală indonezianăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, indoneziană BahasaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 524, Bărbat 454, Necunoscut 2
VorbireIndonesian_MA_16IndonezianăIndonezianăam facut16 kHzMedia Audio643Date audio media indonezieneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 746, Bărbat 1507, Necunoscut 129
VorbireIrish_GC_8irlandezirlandezro_IE8 kHzConversație generală192Date despre conversația generală irlandezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 213 , Bărbat 153 , Necunoscut 0
VorbireJapanese_SM_48Stil JaponezStil Japonezja-JP48 kHzMonolog scenariu2,335Monolog cu scenariu japonezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1460 Bărbat 1221 Necunoscut 194
VorbireKannada_CC_8kannadaKannada (În conductă) kn_INCall center60Datele din centrul de apeluri Kannada (In Pipeline).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireKannada_GCkannadaKannada (În conductă) kn_INConversație generală100Kannada (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireKannada_MAkannadaKannada (În conductă) kn_INMedia Audio40Kannada (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Vorbirecoreeană_CC_8CoreeanăCoreeanăko_KR8 kHzCall center107Datele centrului de apeluri coreeaneConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1086, Bărbat 210, Necunoscut 4
Vorbirecoreeană_MA_16CoreeanăCoreeanăko_KR16 kHzMedia Audio204Date audio media coreeneFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 70 Bărbat 303, Necunoscut 25
VorbireKorean_SM_48CoreeanăCoreeanăko-KR48 kHzMonolog scenariu1,955Monolog cu scenariu coreeanÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1195 Bărbat 1134 Necunoscut 122
VorbireMalay_GC_8malaezianmalaezianms_MY8 kHzConversație generală266Date despre conversația generală malaezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, malay în MalaeziaDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 316, Bărbat 176, Necunoscut 0
VorbireMalay_MA_16malaezianmalaezianms_MY16 kHzMedia Audio344Date audio Malay MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 236, Bărbat 626, Necunoscut 47
VorbireMalayalam_CC_8malayalamMalayalam (În conductă) ml_INCall center60Malayalam (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMalayalam_GCmalayalamMalayalam (În conductă) ml_INConversație generală100Malayalam (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMalayalam_MAmalayalamMalayalam (În conductă) ml_INMedia Audio40Malayalam (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_CC_8marathiMarathi (În conductă) mr_INCall center60Date de la Call-Center Marathi (In Pipeline).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_GCmarathiMarathi (În conductă) mr_INConversație generală100Marathi (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMarathi_MAmarathiMarathi (În conductă) mr_INMedia Audio40Marathi (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireMexican_SM_48Spaniolă (Mexic)Spaniolă (Mexic)ro-MX48 kHzMonolog scenariu1,492Monolog cu scenariu mexican spaniolÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1016 Bărbat 1069 Necunoscut 95
VorbireOlanda_SM_48OlandezăOlandezănl-NL48 kHzMonolog scenariu1,205Monolog cu scenariu olandezÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1285 Bărbat 531 Necunoscut 3
VorbireNew York English_CC_8New York englezăNew York englezăro_8 kHzCall center103New York English Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 610, Bărbat 532, Necunoscut 0
VorbireNew York English_GC_8New York englezăNew York englezăro_8 kHzConversație generală107Date despre conversația generală în limba engleză din New YorkConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 118, Bărbat 114, Necunoscut 0
VorbireNew York English_MA_16New York englezăNew York englezăro_16 kHzMedia Audio140Date audio New York English MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 66, Bărbat 230, Necunoscut 11
VorbireNoua Zeelandă_GC_8engleză din Noua Zeelandă engleză din Noua Zeelandă ro_NZ8 kHzConversație generală148Date de conversație generală în limba engleză din Noua ZeelandăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 167, bărbat 121, Necunoscut 4
VorbireNoua Zeelandă_MA_16engleză din Noua Zeelandă engleză din Noua Zeelandă ro_NZ16 kHzMedia Audio400Audio media engleză din Noua ZeelandăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 367, bărbat 678, Necunoscut 26
VorbireOriya_CC_8oriyaOriya (În conductă) sau_INCall center60Oriya (In Pipeline) Datele Call CenterConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireOriya_GCoriyaOriya (În conductă) sau_INConversație generală100Oriya (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireOriya_MAoriyaOriya (În conductă) sau_INMedia Audio40Oriya (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Vorbirepoloneză_MA_16PolonezăPolonezăpl_PL16 kHzMedia Audio269Audio media polonezăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 173 Bărbat 354 Necunoscut 6
Vorbirepoloneză Polonia_SM_48Poloneză (Polonia)Poloneză (Polonia)pl-PL48 kHzMonolog scenariu1,482Polonia poloneză - Monolog scenariuÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1324 Bărbat 701 Necunoscut 24
VorbirePunjabi_CC_8PunjabiPunjabi (În conductă) PunjabiCall center60Punjabi (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbirePunjabi_GCPunjabiPunjabi (În conductă) PunjabiConversație generală100Punjabi (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbirePunjabi_MAPunjabiPunjabi (În conductă) Punjabi Media Audio40Punjabi (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireRussian_SM_48RusăRusăru-ru48 kHzMonolog scenariu2,398Monolog cu scenariu rusescÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1689 Bărbat 1937 Necunoscut 214
VorbireScottish_GC_8scoțian (accent englezesc)scoțian (accent englezesc)ro_AB8 kHzConversație generală292Date despre conversația generală din ScoțiaConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 285, Bărbat 260, Necunoscut 3
VorbireSingapore_CC_8Singapore englezăSingapore englezăro_SG8 kHzCall center218Date din centrul de apeluri din SingaporeConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 2139, Bărbat 884, Necunoscut 21
VorbireSingapore_MA_16Singapore englezăSingapore englezăro_SG16 kHzMedia Audio247Date audio Singapore MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 160, Bărbat 455, Necunoscut 37
Vorbireengleză sud-africană_CC_8engleză sud-africanăengleză sud-africanăro_ZA8 kHzCall center261Datele centrului de apel în engleză din Africa de SudConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1274 , Bărbat 935 , Necunoscut 1
Vorbireengleză sud-africană_MA_16engleză sud-africanăengleză sud-africanăro_ZA16 kHzMedia Audio251Date audio media engleză din Africa de SudFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 235, Bărbat 432, Necunoscut 36
VorbireSwahili_CC_8SwahiliSwahilisw_KE8 kHzCall center230Datele call-centerului swahiliConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 611, Bărbat 833, Necunoscut 0
VorbireSwahili_MA_16SwahiliSwahilisw_KE16 kHzMedia Audio265Date audio Swahili MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 118, Bărbat 493, Necunoscut 25
Vorbiresuedeză_CC_8SuedezăSuedezăsv_SE8 kHzCall center250Datele call-centerului suedezConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1581, bărbat 727, Necunoscut 2
Vorbiresuedeză_MA_16SuedezăSuedezăsv_SE16 kHzMedia Audio278Date audio media suedezăFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 195, bărbat 500, Necunoscut 21
VorbireTamil_CC_8tamilTamil (În conductă) ta_INCall center60Date din call-center tamil (în conductă).Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTamil_GCtamilTamil (În conductă) ta_INConversație generală100Tamil (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTamil_MAtamil Tamil (În conductă) ta_INMedia Audio40Tamil (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_GC_8telugutelugute_IN8 kHzConversație generală553Telugu General Conversation dateConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 574, Bărbat 564, Necunoscut 0
VorbireTelugu_MA_16telugutelugute_IN16 kHzMedia Audio648Date audio Telugu MediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 207, Bărbat 963, Necunoscut 2
VorbireTelugu_CC_8teluguTelugu (În conductă) te_INCall center30Telugu (In Pipeline) Date call-centerConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_GCteluguTelugu (În conductă) te_INConversație generală50Telugu (In Pipeline) Date generale de conversațieConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,Desktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireTelugu_MAteluguTelugu (În conductă) te_INMedia Audio20Telugu (In Pipeline) Date audio mediaFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
VorbireThai_GC_8ThailandezăThailandezăth_TH8 kHzConversație generală183Conversație generală thailandezăConversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) - 15-60 de minute, un registru informal folosit între prieteniDualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 338, Bărbat 96, Necunoscut 8
VorbireThai_MA_8ThailandezăThailandezăth_TH16 kHzMedia Audio173Audio media thailandezFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 143, Bărbat 502, Necunoscut 26
VorbireTurcia Turcia_SM_48Turcia turceascăTurcia turceascătr-TR48 kHzMonolog scenariu2,027Turcia turceascăÎnregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secundeMonoMobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 1561 Bărbat 1241 Necunoscut 31
Vorbirevietnameză_GC_8VietnamezăVietnamezăvi_VN8 kHzConversație generală295Date de conversație generală vietnamezăConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute, nord (de exemplu, Hanoi), centru și sud (de exemplu, orașul Ho Chi Minh).DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 400, bărbat 380, Necunoscute 2
Vorbirevietnameză_MA_16VietnamezăVietnamezăvi_VN16 kHzMedia Audio257Date audio media vietnamezeFișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. - 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minuteMonoWeb Sourcing5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 249, bărbat 200, Necunoscute 45
VorbireWelsh_GC_8Welsh (accent englezesc)Welsh (accent englezesc)ro_WL8 kHzConversație generală278Date despre conversația generală galezăConversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute,DualDesktop5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăFemeie 270, Bărbat 324, Necunoscut 0
VorbireUK English_WW_16Marea BritanieMarea Britaniero_uk16 kHzWake WordDifuzoarele 200Wake Word engleză britanicăfraze cheie colectare de date
  • boxe 200
  • 4 fraze cheie unice pentru fiecare difuzor
  • 25-30 de înregistrări repetate de fraze cheie pentru fiecare frază cheie unică
  • 25-30 de fișiere audio pentru fiecare frază cheie unică
  • 120 total de enunțuri înregistrate pentru fiecare vorbitor
canal 1Mobile App5.0.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăSex: 50% bărbați, 50% femei, +/- 10%.

Ground Truth Audio & Speech Data pentru a vă accelera dezvoltarea conversațională AI

Cu peste 40 de ore de set de date audio/voce, Shaip vă poate ajuta să vă scalați modelele AI conversaționale cu seturi de date de vorbire de înaltă calitate. Seturile de date de voce standard sunt colectate în mai multe limbi și dialecte, date demografice, trăsături de vorbitor, tipuri de dialog, medii și scenarii. Dacă nu găsești ceea ce cauți? – Shaip vă poate ajuta cu orice set de date vocale, indiferent de sex, vârstă, limbă sau setări.

Câteva dintre seturile de date lingvistice pe care le suportăm: Avem seturi de date pentru toate limbile și dialectele majore. Unele dintre cele mai populare limbi ale noastre includ:

Seturi de date pentru voce africană

Seturi de date pentru voce arabă

Seturi de date Canadian Voice

Seturi de date vocale chineze

Seturi de date vocale daneze

Seturi de date voce în engleză

Seturi de date vocale germane

Seturi de date pentru voce ebraică

Seturi de date vocale indoneziene

Seturi de date pentru voce irlandeză

Seturi de date vocale japoneze

Seturi de date voce coreeană

Seturi de date vocale mexicane

Seturi de date voce poloneză

Seturi de date voce rusă

Seturi de date Scottish Voice

Seturi de date de voce spaniolă

Seturi de date vocale suedeze

Seturi de date Thai Voice

Seturi de date de voce turcească

Seturi de date vocale vietnameze

Descrierea setului de date

Conversații la call center 8khz: Conversație telefonică sintetică, fără scenarii: „agent” și „client”

Conversații generice 8khz: Conversație telefonică fără scenariu între 2 persoane

Media și podcasturi 16 kHz: Interviuri audio/video din domeniul public, podcasturi, etc. 1-5 persoane

Enunț/Monolog scenariu 16 kHz: Înregistrare bazată pe Prompt 

Shaip Contactează-ne

Nu găsești ceea ce cauți?

Sunt colectate noi seturi de date audio și vorbire disponibile pentru toate tipurile de date 

Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire

  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.