Setul de date coreeană
한국어 데이터셋
Centru de apeluri coreean de înaltă calitate, TTS și set de date podcast pentru modele AI și vorbire
Descriere
Titlu
Limba coreeană
Setul de date
Tipul setului de date
Call center
Descriere
Conversație telefonică sintetică, fără scenariu, între „agent” și „client”, aprox. Durata audio (interval) 5-15 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
107
Rata simpla
8 kHz
Canal audio
Dual
Platformă de înregistrare
Desktop
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Coreeană
Limbă
Coreeană
Gen
Femeie 1086, Bărbat 210, Necunoscut 4
Număr de vorbitori
1,300
Vârstă
18-50
Descriere
Titlu
Coreeană Set de date de limbă
Tipul setului de date
Podcast
Descriere
Fișiere audio/video din domeniul public cu licență, cum ar fi interviuri, podcasturi etc. – 1 până la 5 persoane. Aproximativ. Durata audio (interval) 15-60 minute.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
204
Rata simpla
16 kHz
Canal audio
Mono
Platformă de înregistrare
Web Sourcing
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Coreeană
Limbă
Coreeană
Gen
Femeie 70, Bărbat 303, Necunoscut 25
Număr de vorbitori
398
Vârstă
18-50
Descriere
Titlu
Coreeană Set de date de limbă
Tipul setului de date
TTS
Descriere
Înregistrări cu un singur rostire, care tind să se încadreze în intervalul de la 5 la 30 de secunde.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
Total ore
1,955
Rata simpla
48 kHz
Canal audio
Mono
Platformă de înregistrare
Aplicație Mobilă
Format audio
.wav
Format de transcriere
.json
NOI SUNTEM (%)
5
Setul de date demografice
Țară
Coreeană
Limbă
Coreeană
Gen
Femeie 1195, Bărbat 1134, Necunoscut 122
Număr de vorbitori
2,351
Vârstă
18-50
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire