Set de date chinezesc
简体中文数据集
Set de date chinezești de înaltă calitate pentru modele de inteligență artificială și vorbire
Descriere
Titlu (Limbă)
Set de date privind limba chineză
Tipuri de seturi de date
Centru de apeluri, Muzică, Monolog cu scenariu, Date media (Date podcast)
Țară
China
Descriere
Acest set de date include conversații telefonice sintetice nescripționate între agent și client (5-15 minute), conversații telefonice naturale între oameni (15-60 de minute) și transcripții audio vocale, oferind diverse date despre vorbire pentru antrenarea și evaluarea tehnologiilor de vorbire și limbaj.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
| Limbă | Tipul setului de date | Rata de eșantionare | Difuzoare | Canal | Total ore | Numărul total de difuzoare |
|---|---|---|---|---|---|---|
| Cântând chinezesc | Muzică | 48 kHz | Un singur difuzor | Mono | 06:11:32 | 10 |
| Chineză (tradițională) | Monolog scenariu | 48 kHz | Un singur difuzor | Mono | 1,499:00:00 | 1,805 |
| Engleză cu accent chinezesc | Date media | 16 kHz | Boxe multiple | Mono | 306:04:58 | 2,130 |
| Chineza simplificată | Monolog scenariu | 48 kHz | Un singur difuzor | Mono | 2,761:00:00 | 3,725 |
| Engleză cu accent chineză americană | Call Center | 8 kHz | Difuzoarele 2 | Dual | 152:18:33 | 2,058 |
| Engleză cu accent chineză americană | Date media | 16 kHz | Boxe multiple | Mono | 245:55:15 | 468 |
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.
Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire