Setul de date coreeană

한국어 데이터셋

Set de date de înaltă calitate pentru centre de apel coreene, monologuri scenarizate și media (podcast) pentru modele de inteligență artificială și vorbire

Descriere

Titlu (Limbă)

Setul de date în limba coreeană

Tipuri de seturi de date

Centru de apeluri, Date media, Monolog cu scenariu

Țară

Coreea

Descriere

Acest set de date include conversații telefonice sintetice nescripționate între agent și client (5-15 minute), fișiere audio/video licențiabile din domeniul public, cum ar fi interviuri și podcasturi cu 1 până la 5 participanți (15-60 de minute) și monologuri scriptate cu un singur vorbitor care oferă conținut predefinit pentru antrenarea modelelor de vorbire și limbaj.

Utilizare caz

ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică

Detalii setului de date

Tipul setului de date Rata de eșantionare Difuzoare Canal Total ore Numărul total de difuzoare
Call Center 8 kHz Difuzoarele 2 Dual 102:27:55 1,244
Date media 16 kHz Boxe multiple Mono 203:46:54 397
Monolog scenariu 24 kHz Un singur difuzor Mono 500:00:00 La cerere
Monolog scenariu 48 kHz Un singur difuzor Mono 1,955:00:00 La cerere

Clienți prezentați

Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Amazon
Google
Microsoft
Shaip contactați-ne

Nu găsești ceea ce cauți?

Sunt colectate noi seturi de date disponibile pentru toate tipurile de date

Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire

  • Acest câmp este pentru scopuri de validare și trebuie să rămână neschimbate.
  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.