Set de date arabă și thailandeză și vietnameză și hindi și engleză și chineză

Casetă de delimitare+Text

Set de date arabă și thailandeză și vietnameză și hindi și engleză și chineză

Utilizare caz: OCR

Format: Imagine

Numara: 150k

Adnotare: Da

X

Descriere: Set de date arabă și thailandeză și vietnameză și hindi și engleză și chineză

Set de date text arab

Casetă de delimitare+Text

Set de date text arab

Utilizare caz: OCR

Format: Imagine

Numara: 1k

Adnotare: Da

X

Descriere: Setul de date de text arabă conține o colecție de exemple de text scrise în arabă. Include diverse forme de conținut, cum ar fi articole de știri, postări pe rețelele sociale, literatură și dialog, care acoperă diferite subiecte și stiluri de scriere. Acest set de date este utilizat pentru sarcini precum procesarea limbajului natural (NLP), clasificarea textului, analiza sentimentelor și traducerea automată în aplicațiile în limba arabă.

Set de date chineză și engleză și tibetană și uigură

Casetă de delimitare+Text

Set de date chineză și engleză și tibetană și uigură

Utilizare caz: OCR

Format: Imagine

Numara: 38k

Adnotare: Da

X

Descriere: Set de date chineză și engleză și tibetană și uigură

Set de date pentru meniul chineză și engleză

Casetă de delimitare+Text

Set de date pentru meniul chineză și engleză

Utilizare caz: OCR

Format: Imagine

Numara: 60k

Adnotare: Da

X

Descriere: Setul de date pentru meniuri în chineză și engleză conține imagini sau eșantioane de text ale meniurilor de restaurante care prezintă atât limbile chineză, cât și engleză. Include diverse fonturi, machete și structuri de meniu, prezentând nume, descrieri și prețuri bilingve ale preparatelor. Acest set de date este util pentru sarcini precum recunoașterea optică a caracterelor (OCR), traducerea automată și digitizarea meniurilor în setări multilingve.

Set de date de compoziție scrisă de mână în chineză

Casetă de delimitare+Text

Set de date de compoziție scrisă de mână în chineză

Utilizare caz: OCR

Format: Imagine

Numara: 3k

Adnotare: Da

X

Descriere: Setul de date de compoziție scrisă de mână în chineză conține mostre de text scris de mână în limba chineză, inclusiv compoziții, eseuri și alte texte de formă lungă. Dispune de diferite stiluri de scriere de mână și niveluri de complexitate și este utilizat pentru sarcini precum recunoașterea scrisului de mână, analiza textului și formarea modelelor de învățare automată.

Setul de date chinezesc WIFI prompt

Casetă de delimitare+Text

Setul de date chinezesc WIFI prompt

Utilizare caz: OCR

Format: Imagine

Numara: 1k

Adnotare: Da

X

Descriere: Setul de date pentru prompturi WIFI chinezești constă din exemple de text găsite în solicitările WIFI și ecrane de conectare scrise în limba chineză. De obicei, include diverse solicitări, instrucțiuni și mesaje de eroare legate de conectarea la sau gestionarea rețelelor WIFI. Acest set de date este utilizat pentru sarcini precum recunoașterea textului, procesarea limbajului natural și îmbunătățirea interfețelor utilizator pentru conectivitate la rețea.

Set de date pentru scrierea de mână în engleză și chineză

Casetă de delimitare+Text

Set de date pentru scrierea de mână în engleză și chineză

Utilizare caz: OCR

Format: Imagine

Numara: 12k

Adnotare: Da

X

Descriere: Setul de date pentru scrierea de mână în engleză și chineză conține mostre scrise de mână atât în ​​engleză, cât și în chineză, prezentând diferite stiluri de scriere și complexități de caractere. Este folosit de obicei pentru instruirea și evaluarea modelelor de recunoaștere a scrisului de mână, pentru a sprijini analiza textului multilingv și alte cercetări conexe. Setul de date include o gamă diversă de caractere, cifre, cuvinte și propoziții în ambele limbi.

Setul de date Shopsign în engleză și chineză

Casetă de delimitare+Text

Setul de date Shopsign în engleză și chineză

Utilizare caz: OCR

Format: Imagine

Numara: 30k

Adnotare: Da

X

Descriere: Setul de date pentru semne comerciale în engleză și chineză include imagini cu semne de magazine care prezintă atât text în engleză, cât și în chineză. Acesta captează diverse elemente de semnalizare, cum ar fi numele magazinelor, reclame, promoții și indicații, afișate în diverse fonturi, stiluri și formate. Acest set de date este utilizat pentru sarcini precum detectarea și recunoașterea textului, înțelegerea scenei multilingve și îmbunătățirea modelelor de viziune computerizată pentru interpretarea semnalizării bilingve.

Setul de date cu unghi special în engleză și chineză

Casetă de delimitare+Text

Setul de date cu unghi special în engleză și chineză

Utilizare caz: OCR

Format: Imagine

Numara: 50k

Adnotare: Da

X

Descriere: Setul de date cu text special pentru unghiuri în engleză și chineză conține imagini ale textului afișate în diferite unghiuri și orientări atât în ​​engleză, cât și în chineză. Include text din surse precum semne, reclame și documente care nu sunt prezentate în formate orizontale standard. Acest set de date este utilizat pentru instruirea și evaluarea modelelor de detectare și recunoaștere a textului, în special a celor capabile să manipuleze text în orientări și perspective netradiționale.

Set de date meniul englez

Casetă de delimitare+Text

Set de date meniul englez

Utilizare caz: OCR

Format: Imagine

Numara: 20k

Adnotare: Da

X

Descriere: Setul de date meniul în limba engleză include imagini sau exemple de text ale meniurilor de restaurante scrise în limba engleză. Dispune de o varietate de fonturi, machete și stiluri de formatare, cu conținut variind de la nume de feluri de mâncare la descrieri și prețuri. Acest set de date este adesea folosit pentru sarcini precum recunoașterea optică a caracterelor (OCR), extragerea textului și digitizarea meniului în aplicații legate de alimente.

Set de date text Scene engleze

Casetă de delimitare+Text

Set de date text Scene engleze

Utilizare caz: OCR

Format: Imagine

Numara: 33k

Adnotare: Da

X

Descriere: Setul de date cu text în limba engleză este format din imagini care conțin scene naturale cu text în limba engleză încorporat. Textul apare sub diferite forme, cum ar fi semne, panouri publicitare și afișe, adesea în diverse fonturi, dimensiuni și orientări. Acest set de date este utilizat în mod obișnuit pentru instruirea și testarea modelelor în sarcinile de detectare, recunoaștere și înțelegere a scenei de text.

Set de date text scris de mână

Set de date text scris de mână

Utilizare caz: Document AI

Format: HEIC (imagini) și .mov (videoclipuri)

Numara: 94053

Adnotare: Nu

X

Descriere: Fotografii live cu text scris de mână pentru japoneză, coreeană și rusă

Dispozitiv de inregistrat: Cameră pentru iPhone și iPad

Condiție de înregistrare: - Iluminare/strălucire agresivă - Blițul aparatului foto pornit - Lumină colorată - Lumină scăzută, Fără bliț al camerei - Normal

Set de date în limba japoneză și coreeană

Casetă de delimitare+Text

Set de date în limba japoneză și coreeană

Utilizare caz: OCR

Format: Imagine

Numara: 40k

Adnotare: Da

X

Descriere: Setul de date pentru limba japoneză și coreeană include exemple de text atât în ​​japoneză, cât și în coreeană. Prezintă o gamă largă de conținut, cum ar fi propoziții, fraze și cuvinte, cuprinzând diverse contexte și stiluri. Acest set de date este utilizat pentru sarcini precum procesarea limbajului natural (NLP), traducerea automată și analiza textului în aplicații multilingve.