Setul de date swahili
Hifadhidata și Kiswahili
Centru de apeluri swahili și set de date podcast de înaltă calitate pentru modele AI și vorbire
Descriere
Titlu
Swahili Set de date de limbă
Tipul setului de date
Call center
Descriere
Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
230
Rata simpla
8 kHz
Canal audio
Dual
Platformă de înregistrare
Desktop
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Swahili
Limbă
Swahili
Gen
Femeie 611, Bărbat 833, Necunoscut 0
Număr de vorbitori
1,444
Vârstă
18-50
Descriere
Titlu
Swahili Set de date de limbă
Tipul setului de date
Podcast
Descriere
Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. – 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
265
Rata simpla
16 kHz
Canal audio
Mono
Platformă de înregistrare
Web Sourcing
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Swahili
Limbă
Swahili
Gen
Femeie 118, Bărbat 493, Necunoscut 25
Număr de vorbitori
636
Vârstă
18-50
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire