Setul de date indonezian
Kumpulan Data Indonesia
Set de date de conversație generală și podcast indoneziană de înaltă calitate pentru modele AI și vorbire
Descriere
Titlu
Indoneziană Set de date de limbă
Tipul setului de date
Conversație generală
Descriere
Conversație telefonică fără scenariu între două persoane. Aproximativ. Durata audio (interval) – 15-60 de minute, indoneziană Bahasa.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
496
Rata simpla
8 kHz
Canal audio
Dual
Platformă de înregistrare
Desktop
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Indonesia
Limbă
Indoneziană
Gen
Femeie 524, Bărbat 454, Necunoscut 2
Număr de vorbitori
980
Vârstă
18-50
Descriere
Titlu
Indoneziană Set de date de limbă
Tipul setului de date
Podcast
Descriere
Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. – 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
643
Rata simpla
16 kHz
Canal audio
Mono
Platformă de înregistrare
Web Sourcing
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Indonesia
Limbă
Indoneziană
Gen
Femeie 746, Bărbat 1507, Necunoscut 129
Număr de vorbitori
2,382
Vârstă
18-50
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire