Set de date tamil
தமிழ் தரவுத்தொகுப்பு
Deblocați puterea seturilor de date despre vorbirea în limba tamilă pentru ASR, TTS și inteligență artificială conversațională. Shaip oferă seturi de date audio premium în limba tamilă pentru a antrena modele lingvistice mai inteligente.
Descriere
Titlu (Limbă)
Set de date pentru limba tamilă
Tipuri de seturi de date
Centru de apeluri, Conversație generală, Date media, Monolog cu scenariu
Țară
India
Descriere
Acest set de date include conversații sintetice nescripționate între agent și client (5–15 minute), conversații telefonice naturale între oameni (15–60 de minute) și date media cu transcrieri, oferind diverse date despre vorbire pentru antrenarea și evaluarea tehnologiilor de vorbire și limbaj.
Utilizare caz
ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică
Detalii setului de date
| Tipul setului de date | Rata de eșantionare | Difuzoare | Canal | Total ore | Numărul total de difuzoare |
|---|---|---|---|---|---|
| Call Center | 8 kHz | Difuzoarele 2 | Dual | 124:23:52 | 484 |
| Call Center | 16 kHz | Difuzoarele 2 | Mono | 199:44:21 | 1,986 |
| Conversație generală | 8 kHz | Difuzoarele 2 | Dual | 101:42:05 | 440 |
| Conversație generală | 48 kHz | Difuzoarele 2 | Mono | 80:21:16 | 141 |
| Date media | 16 kHz | Boxe multiple | Mono | 43:07:01 | 32 |
| Monolog scenariu | 24 kHz | Un singur difuzor | Mono | 500:00:00 | La cerere |
Clienți prezentați
Împuternicirea echipelor să construiască produse AI de top la nivel mondial.
Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire