Setul de date engleză Deep South
Centru de apeluri în limba engleză Deep South de înaltă calitate, conversație generală și set de date podcast pentru modele AI și vorbire
Descriere
Titlu (Limbă)
Set de date privind limba engleză din sudul profund
Tipuri de seturi de date
Centru de apeluri, Conversații generale, Date media (Podcast)
Țară
Sudul Statelor Unite
Descriere
Conversațiile telefonice sintetice nescripționate între un agent și un client sunt disponibile cu durate de 5 până la 15 minute, în timp ce conversațiile telefonice nescripționate între două persoane variază de obicei între 15 și 60 de minute. În plus, fișierele audio sau video din domeniul public licențiabile, cum ar fi interviurile sau podcasturile cu 1 până la 5 participanți, sunt, de asemenea, disponibile în intervalul 15-60 de minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
| Tipul setului de date | Rata de eșantionare | Difuzoare | Canal | Total ore | Numărul total de difuzoare |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Difuzoarele 2 | Dual | 266:44:22 | 634 |
| Conversație generală | 8 kHz | Difuzoarele 2 | Dual | 197:25:07 | 1,490 |
| Date media | 16 kHz | Boxe multiple | Mono | 261:20:58 | 565 |
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.
Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire
Descriere
Titlu
Sudul Adanc englezesc Set de date de limbă
Tipul setului de date
Call center
Descriere
Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
151
Rata simpla
8 kHz
Canal audio
Dual
Platformă de înregistrare
Desktop
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Sudul Adanc englezesc
Limbă
Sudul Adanc englezesc
Gen
Femeie 221, Bărbat 1004, Necunoscut 7
Număr de vorbitori
1,232
Vârstă
18-50
Descriere
Titlu
Sudul Adanc englezesc Set de date de limbă
Tipul setului de date
Conversație generală
Descriere
Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) – 15-60 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
56
Rata simpla
8 kHz
Canal audio
Dual
Platformă de înregistrare
Desktop
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Sudul Adanc englezesc
Limbă
Sudul Adanc englezesc
Gen
Femeie 99, Bărbat 31, Necunoscut 0
Număr de vorbitori
130
Vârstă
18-50
Descriere
Titlu
Sudul Adanc englezesc Set de date de limbă
Tipul setului de date
Podcast
Descriere
Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. – 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
266
Rata simpla
16 kHz
Canal audio
Mono
Platformă de înregistrare
Web Sourcing
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Sudul Adanc englezesc
Limbă
Sudul Adanc englezesc
Gen
Femeie 204, Bărbat 356, Necunoscut 21
Număr de vorbitori
581
Vârstă
18-50