Set de date tamil

தமிழ் தரவுத்தொகுப்பு

Deblocați puterea seturilor de date despre vorbirea în limba tamilă pentru ASR, TTS și inteligență artificială conversațională. Shaip oferă seturi de date audio premium în limba tamilă pentru a antrena modele lingvistice mai inteligente.

Descriere

Titlu (Limbă)

Set de date pentru limba tamilă

Tipuri de seturi de date

Centru de apeluri, Conversație generală, Date media, Monolog cu scenariu

Țară

India

Descriere

Acest set de date include conversații sintetice nescripționate între agent și client (5–15 minute), conversații telefonice naturale între oameni (15–60 de minute) și date media cu transcrieri, oferind diverse date despre vorbire pentru antrenarea și evaluarea tehnologiilor de vorbire și limbaj.

Utilizare caz

ASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvistică

Detalii setului de date

Tipul setului de date Rata de eșantionare Difuzoare Canal Total ore Numărul total de difuzoare
Call Center 8 kHz Difuzoarele 2 Dual 124:23:52 484
Call Center 16 kHz Difuzoarele 2 Mono 199:44:21 1,986
Conversație generală 8 kHz Difuzoarele 2 Dual 101:42:05 440
Conversație generală 48 kHz Difuzoarele 2 Mono 80:21:16 141
Date media 16 kHz Boxe multiple Mono 43:07:01 32
Monolog scenariu 24 kHz Un singur difuzor Mono 500:00:00 La cerere

Clienți prezentați

Împuternicirea echipelor să construiască produse AI de top la nivel mondial.

Amazon
Google
Microsoft
Shaip contactați-ne

Nu găsești ceea ce cauți?

Sunt colectate noi seturi de date disponibile pentru toate tipurile de date

Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de antrenament audio/vorbire

  • Acest câmp este pentru scopuri de validare și trebuie să rămână neschimbate.
  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.