Set de date cec bancar (Document AI)
Utilizare caz: OCR
Format: .jpg
Numara: 2023
Adnotare: Nu
Descriere: Setul de date pentru cecuri bancare (Document AI): Cecurile bancare sintetice constau în imagini de cecuri generate artificial, concepute pentru a reproduce aspectul și conținutul cecurilor reale. Include diverse elemente, cum ar fi numele beneficiarilor, sumele, datele, semnăturile și numerele cecurilor. Acest set de date este utilizat pentru instruirea și evaluarea sistemelor Document AI în sarcini precum recunoașterea optică a caracterelor (OCR), procesarea cecurilor și extragerea automată a datelor, oferind un mediu controlat pentru dezvoltarea modelului fără preocupările de confidențialitate ale cecurilor reale.
Condiție de înregistrare: - Imagini făcute clic - Scanat - Web scrapper
Set de date extras de cont (Document AI)
Utilizare caz: OCR
Format: .jpg, png
Numara: 5366
Adnotare: Nu
Descriere: Setul de date privind extrasul de cont (Document AI): extrasele bancare sintetice includ extrase de cont generate artificial, concepute pentru a simula documente financiare reale. Dispune de diferite înregistrări ale tranzacțiilor, date, sume și detalii de cont, structurate pentru a reflecta formate și conținut din lumea reală. Acest set de date este utilizat pentru instruirea și evaluarea sistemelor Document AI în sarcini precum recunoașterea optică a caracterelor (OCR), extragerea datelor și analiza documentelor, oferind un mediu controlat fără problemele de confidențialitate ale datelor financiare reale.
Condiție de înregistrare: - Scanat - Bank_Statement - Web scrapper
Setul de date pentru facturile chinezești
Utilizare caz: OCR
Format: Imagine
Numara: 6k
Adnotare: Da
Descriere: Setul de date privind facturile chinezești include imagini sau exemple de text ale diferitelor tipuri de facturi, cum ar fi facturi, chitanțe și extrase de cont, scrise în limba chineză. Dispune de diverse formate și conținut, inclusiv descrieri ale articolelor, sume și date. Acest set de date este utilizat pentru sarcini precum recunoașterea optică a caracterelor (OCR), procesarea documentelor financiare și extragerea automată a datelor.
Documente / OCR – Set de date privind conținutul OCR în arabă și engleză
Utilizare caz: Documente / OCR
Format: imagini
Numara: 1,321
Adnotare: Nu
Descriere: Colecție de imagini cu conținut arabă și engleză: Imagine + adnotare pentru OCR
Documente / OCR – Set de date cu videoclipuri cu coduri de bare

Utilizare caz: Documente / OCR
Format: Video
Numara: 2,767
Adnotare: Nu
Descriere: Videoclipuri cu coduri de bare (Code128, UPC/EAN, PDF417, Aztec, Multi-code)
Documente / OCR – Set de date text imprimat curbat

Utilizare caz: Documente / OCR
Format: imagini
Numara: 18,986
Adnotare: Nu
Descriere: Text imprimat curbat: Colectați imagini cu text curbat sau text cu linie de bază neliniară
Documente / OCR – Documente financiare (bancare, fluturaș de salariu, impozite, SUA)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 26,446
Adnotare: Nu
Descriere: Documente financiare: extras de cont bancar, cec, fluturaș de salariu, impozit, credit ipotecar, cereri de despăgubire (SUA)
Documente / OCR – Documente financiare (Faza 1 – Credit ipotecar)
Utilizare caz: Documente / OCR
Format: imagini
Numara: 9,192
Adnotare: Nu
Descriere: Documente financiare (Faza 1) Set de date ipotecare – imprimare, scanare, fotografiere
Documente / OCR – Documente financiare (Faza 2 – Asigurări)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 7,636
Adnotare: Nu
Descriere: Documente financiare (Faza 2) Set de date privind asigurările – imprimare, scanare, fotografiere
Documente / OCR – Set de date text scris de mână (JP/KR/RU)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 106,313
Adnotare: Nu
Descriere: Text scris de mână: LivePhotos cu text scris de mână (japoneză, coreeană, rusă)
Documente / OCR – Set de date facturi cu adnotare în caseta de delimitare

Utilizare caz: Documente / OCR
Format: imagini
Numara: 87
Adnotare: Da
Descriere: Setul de date privind facturile cu adnotări în casete de delimitare include facturi scanate sau digitale în care câmpurile cheie, cum ar fi numărul facturii, data, detaliile furnizorului, articolele și sumele totale, sunt etichetate cu casete de delimitare, permițând modelelor de inteligență artificială să detecteze și să extragă cu precizie informații structurate din documentele nestructurate.
Documente / OCR – LivePhotos cu text imprimat (JP/KR/RU)
Utilizare caz: Documente / OCR
Format: imagini
Numara: 4,944
Adnotare: Nu
Descriere: LivePhotos cu text tipărit (japoneză, coreeană, rusă)
Documente / OCR – Set de date pentru chitanțe/facturi multilingve

Utilizare caz: Documente / OCR
Format: imagini
Numara: 8,961
Adnotare: Nu
Descriere: Setul de date multilingve privind chitanțele și facturile cuprinde diverse documente financiare în mai multe limbi, permițând modelelor de inteligență artificială să se antreneze pentru recunoașterea textului în mai multe limbi, extragerea câmpurilor cheie și înțelegerea documentelor.
Documente / OCR – Extrase de cont sintetice (40 de șabloane)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 1,290
Adnotare: Nu
Descriere: Extrase de cont - Șablon unic - 40: Extrase de cont sintetice
Documente / OCR – Fluturași de salariu sintetici (60 de șabloane)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 2,010
Adnotare: Nu
Descriere: Cec - Șablon unic - 60: Fluturași de salariu sintetici
Documente / OCR – Fluturași de salariu sintetici (130 de șabloane)

Utilizare caz: Documente / OCR
Format: imagini
Numara: 2,023
Adnotare: Nu
Descriere: Fluturași de salariu - Șablon unic - 130: Cec bancar sintetic
Setul de date pentru bonuri de plată (Document AI)

Utilizare caz: OCR
Format: .jpg
Numara: 2010
Adnotare: Nu
Descriere: Setul de date privind fișele de plată (Document AI): fișele de plată sintetice constă din imagini ale fișelor de plată generate artificial, fără adnotări. Dispune de diverse formate și detalii de talon de salariu, cum ar fi numele angajaților, salariile și datele, utilizate pentru instruirea și testarea sistemelor Document AI în sarcini precum OCR și procesarea documentelor.
Condiție de înregistrare: - Scanat - Web scrapper

