Set de date chinezesc

简体中文数据集

Set de date chinezești de înaltă calitate pentru modele de inteligență artificială și vorbire

Descriere

Titlu (Limbă)

Set de date privind limba chineză

Tipuri de seturi de date

Centru de apeluri, Muzică, Monolog cu scenariu, Date media (Date podcast)

Țară

China

Descriere

Acest set de date include conversații telefonice sintetice nescripționate între agent și client (5-15 minute), conversații telefonice naturale între oameni (15-60 de minute) și transcripții audio vocale, oferind diverse date despre vorbire pentru antrenarea și evaluarea tehnologiilor de vorbire și limbaj.

Utilizare caz

ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică

Detalii setului de date

Limbă Tipul setului de date Rata de eșantionare Difuzoare Canal Total ore Numărul total de difuzoare
Cântând chinezesc Muzică 48 kHz Un singur difuzor Mono 06:11:32 10
Chineză (tradițională) Monolog scenariu 48 kHz Un singur difuzor Mono 1,499:00:00 1,805
Engleză cu accent chinezesc Date media 16 kHz Boxe multiple Mono 306:04:58 2,130
Chineza simplificată Monolog scenariu 48 kHz Un singur difuzor Mono 2,761:00:00 3,725
Engleză cu accent chineză americană Call Center 8 kHz Difuzoarele 2 Dual 152:18:33 2,058
Engleză cu accent chineză americană Date media 16 kHz Boxe multiple Mono 245:55:15 468

Clienți prezentați

Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Shaip contactați-ne

Nu găsești ceea ce cauți?

Sunt colectate noi seturi de date disponibile pentru toate tipurile de date

Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire

  • Acest câmp este pentru scopuri de validare și trebuie să rămână neschimbate.
  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.