Acum Ia 50% REDUCERE* pe seturi de date AI conversaționale disponibile

Set de date vocale și audio pentru chatboți, asistenți vocali, dispozitive activate pentru vorbire.

*Ofertă pe perioadă limitată

  • Prin înregistrare, sunt de acord cu Shaip Politica de Confidențialitate și Termeni şi Condiții și îmi dau consimțământul pentru a primi comunicări de marketing B2B de la Shaip.

Liderii din industrie au încredere

DetaliiSet de date de limbă disponibil la raftConversații din call center 8khz*Conversații generice 8khz*Media și podcasturi 16 kHz*Enunț/Monolog scenariu 16 kHz*Volumul total în oreDialecte acoperiteFormat audioFormat de transcriere textUtilizare cazSursăCTA
VorbireafrikaansSetul de date audio africană6009001500Afrikaans vorbit în Africa.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireArabăSetul de date audio arabe80015002300arabă din țările din Golf.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireChinezăSetul de date audio chinezesc20002000Chineză din China.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbiredanezăSetul de date audio danez40060020003000danez din Danemarca.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireOlandezăSet de date audio olandez20002000olandeză din Olanda.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - AAVE AccentEngleză - Set de date audio AAVE (engleză vernaculară afro-americană).5005001000Varietatea vernaculară (uneori cunoscută sub numele de AAVE, vorbită în mod obișnuit de marea majoritate a afro-americanilor din clasa muncitoare și de mijloc) și varietatea mai standard (vorbită de obicei de afro-americani din clasa de mijloc în situații formale și publice), dar cu un accent mai puternic pe limba populară..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireEngleză - Boston/New York AccentEngleză - Set de date audio Boston/New York225225350800Aceasta este o colecție de mai multe accente regionale vorbite în și în jurul orașelor Boston, New York și Philadelphia. Aceste accente ar putea suna similar cu non-localnici, dar distincte de alte accente americane. În ciuda unui vocabular local care este diferit de alte părți ale lumii vorbitoare de engleză, aceste accente sunt reciproc inteligibile cu engleza vorbită în altă parte..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - accent chinezescEngleză - set de date audio cu accent chinezesc150300450Vorbitori care vorbesc limba chineză ca primă limbă și care s-au mutat/au imigrat în Statele Unite ca adolescenți/adulti și au învățat engleza ca a doua limbă..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireEngleză - Accent de sud adâncEngleză - Deep South Audio Dataset2752754501000Vorbitori din (i) Texas; (ii) Carolina de Nord, Carolina de Sud, Georgia; (iii) New Orleans; (iv) Florida Panhandle; (v) Tennessee, Arkansas, Michigan..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - accent hispanicEngleză - set de date audio cu accent hispanic400400800Engleza hispanică se referă la varietățile de engleză americană vorbite de americanii hispanici de moștenire națională diversă. Accentul principal a fost pus pe mexicano-americani, vorbitori de diferite origini naționale (de exemplu, Mexic, Puerto Rico, Republica Dominicană, Ecuador, Cuba etc.) și din diferite regiuni (de exemplu, California, New York, Florida). Au fost incluși vorbitori care vorbesc spaniola ca primă limbă, precum și vorbitorii de origine hispanica care vorbesc spaniola are o limbă de moștenire..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireEngleză - Accent Noua ZeelandăEngleză - Setul de date audio din Noua Zeelandă2507501000Difuzoare pe ambele insule, inclusiv un amestec de vorbitori mai tineri (<40 de ani) și vorbitori mai în vârstă (>40 de ani) în proporții egale..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - Singapore AccentEngleză - Singapore Audio Dataset4006001000Atât engleza standard Singapore, cât și engleza colocvială Singapore. Singaporeeni de diferite origini etnice (de exemplu, chinezi, malay, indieni etc.) și de diferite niveluri educaționale..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireEngleză - Africa de Sud AccentEngleză - Africa de Sud Audio Dataset4006001000Reprezentanți din diferite clase socioeconomice și medii etnologice (de exemplu, sud-africani de origine europeană, africană, indiană sau mixtă)..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - accent irlandezEngleză - Setul de date audio irlandez500500Engleza vorbita in Irlanda.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - accent scoțianEngleză - Scottish Audio Dataset800800Engleza vorbită de scoțian.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbireengleză - accent galezEngleză - Welsh Audio Dataset800800engleza galeza.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
Vorbirecanadian francezSet de date audio canadian francez10001000Franceză canadiană.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireebraicăSet de date audio ebraică7507501500ebraică în Israel.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireIndonezianăSetul de date audio indonezian100010002000Bahasa indoneziană.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireJaponezSet de date audio japoneză20002000Japonez din Japonia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireCoreeanăSetul de date audio coreeană10020015001800Vorbitorii s-au răspândit în toată Coreea de Sud..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbiremalaezianSetul de date audio malaeză5005001000Malay în Malaezia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireSpaniolă mexicanăSet de date audio mexican spaniol12501250Mexican din Mexic.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirePolonezăSetul de date audio polonez25020002250polonez din Polonia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireRusăSetul de date audio rusesc20002000rusă din Rusia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireSwahiliSet de date audio swahili3506501000Swahili din Africa de Sud și Kenya.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireSuedezăSetul de date audio suedez3506501000suedeză în Suedia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireChineză din TaiwanSetul de date audio chinezesc din Taiwan10001000Chineză din Taiwan.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireThailandezăSet de date audio thailandez350450800Un registru informal folosit între prieteni,.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireTurcăSet de date audio turc20002000turcesc din Turcia.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireVietnamezăSet de date audio vietnamez6004001000Nord (de exemplu, Hanoi), Centru și Sud (de exemplu, Ho Chi Minh City)..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirehindiSetul de date audio hindi80020002800Hindi în India, în special în regiunile de nord, est și vest.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirehinglishSetul de date audio din engleză indiană300500800Colectat din orașele indiene urbane care sunt centre financiare ale țării datorită oportunităților economice în creștere. Astfel de locuri pot fi Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad etc..wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireEnglezăSetul de date audio în engleză700700.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirekannadaSetul de date audio Kannada6010040200Kannada din Karnataka, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbiremalayalamSetul de date audio malayalam6010040200Malayalam din Kerala, Lakshadweep și Puducherry.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireoriyaSetul de date audio Oriya6010040200Oriya din părți din Odisha, Bengalul de Vest, Jharkhand și Chhattisgarh.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirePunjabiSet de date audio punjabi6010040200Punjabi din Punjab, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbiretamilSet de date audio tamil60100240400Tamil din Tamil Nadu, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireteluguSet de date audio telugu1009509502000Telugu din Andhra Pradesh, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbirebengalezăSetul de date audio bengalezi6010040200Bengali din Bengalul de Vest, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireGujaratiSet de date audio gujarati6010040200Gujarati din Gujarat, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbiremarathiSetul de date audio marathi6010040200Marathi din Maharashtra, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip
VorbireAssamezăSet de date audio assameză6010040200Assameze din Assam, India.wav.jsonASR, Asistent virtual, Chatbot, IA conversațională, Analiza vorbirii, TTS, Modelare lingvisticăShaip

Expertiză profundă în IA conversațională

AI conversațional sau chatbot-urile sau asistenții virtuali/digitali sunt la fel de inteligenți ca tehnologia și datele din spatele lor. La Shaip, vă oferim un set larg de date audio diversificate pentru procesarea limbajului natural (NLP) care imită conversațiile cu oameni reali, ceea ce vă permite să vă aduceți AI la viață. Cu înțelegerea noastră profundă, vă ajutăm să construiți și să localizați modele de vorbire activate AI, cu cea mai mare precizie, cu seturi de date bogate și structurate în mai multe limbi de pe tot globul. Oferim servicii de colectare audio, transcriere audio și adnotare audio în mai multe limbi în funcție de cerințele dvs., personalizând în același timp intenția, enunțurile și distribuția demografică dorite.

Colecție de discursuri scriptate

Culegere Spontaneous Speech

Transcrierea datelor audio

Etichetarea și adnotarea datelor

Shaip vă permite să vă antrenați cu precizie Platforma AI conversațională, astfel încât să poată:

  • Vorbește, trimite mesaje și chat fără probleme pe mai multe canale.
  • Învață din interacțiunile existente sub formă de chat, transcrieri vocale, tranzacții etc. și sugerează și conversa, pe baza acestor învățături.
  • Înțelegeți intenția din spatele vorbirii umane și eliminați ambiguitatea în înțelegerea limbajului uman.
  • Interacționează cu tine în mod individual și poți fi instruit pentru a identifica utilizatorii și a-ți aminti conversațiile anterioare.

Un lider mondial în datele de instruire conversaționale AI

Ore de date audio în peste 100 de limbi – cu sursă, transcrise și adnotate

Licențierea datelor de vorbire

Peste 20 de ore de date despre vorbire în peste 40 de limbi și dialecte care acoperă o gamă de peste 55 de subiecte din diferite domenii, de exemplu, call-center, dezbateri, conversații generale, discursuri, podcasturi etc.

Colectarea datelor de vorbire

Colectați date audio și de vorbire (monolog, conversație cu 2 persoane, chat uman-bot) în peste 100 de limbi din întreaga lume, personalizate conform cerințelor dvs. de AI.

Transcrierea datelor vorbirii

Transcriere audio sau adnotare audio rentabilă printr-o forță de muncă puternică de 30,000 de colaboratori cu TAT, acuratețe și economii garantate

Accelerează-ți dezvoltarea aplicației conversaționale AI cu Audio Collection & Audio Adnotation Services

Avantajul Shaip

Scara

Putem sursa, scala și livra date audio din întreaga lume în mai multe limbi și dialecte, în funcție de cerințele dvs.

Expertiza

Avem expertiza potrivită în ceea ce privește colectarea, transcrierea și adnotarea standard de aur a datelor precise și impartiale.

Reţea

O rețea de peste 30,000 de colaboratori calificați, cărora li se pot atribui rapid sarcini de colectare a datelor pentru a construi modele de instruire AI și servicii de extindere.

Tehnologia

Avem o platformă complet bazată pe inteligență artificială, cu instrumente și procese proprietare, pentru a profita de gestionarea fluxului de lucru 24/7 non-stop.

Agilitate

Ne adaptăm la schimbările cerințelor clienților foarte rapid și ajutăm la accelerarea dezvoltării AI cu date de vorbire de calitate de 5-10 ori mai rapid decât concurența.

Securitate

Acordăm cea mai mare importanță securității și confidențialității datelor și suntem, de asemenea, certificati pentru a gestiona date sensibile foarte reglementate.

Ce facem cel mai bine

Date de instruire

Obțineți date etichetate de cea mai înaltă calitate într-o fracțiune de timp. Este standardul de aur, fiabil și pregătit pentru a vă antrena modelele AI și ML pentru a atinge cele mai înalte niveluri de performanță.

Aflaţi mai multe

Colectarea datelor, etichetarea și adnotarea

Cu Shaip obțineți peste 15 ani de experiență dovedită în colectarea, transcrierea și adnotarea datelor de calitate. Cu forța noastră de muncă globală, putem colecta date de pe tot globul, apoi oferim servicii de etichetare și adnotare cu nivelul perfect de calificare și expertiză necesare pentru datele dvs.

Aflaţi mai multe

Cataloage de date și licențiere

Cu inventarul nostru vast de milioane de seturi de date, puteți colecta și organiza după cum este necesar. Putem apoi licenția acele date de calitate pentru cerințele dvs. specifice de utilizare a AI și ML. În plus, aceste date sunt disponibile la o fracțiune din costul dacă ar fi să le creați singur.

Aflaţi mai multe

Doriți să vă construiți propriul set de date?

Contactați-ne acum pentru a afla cum putem colecta un set de date personalizat pentru soluția dvs. unică de IA.