Set de date DICOM pentru imagistică medicală pentru aplicații avansate de inteligență artificială/aprindere automată în domeniul sănătății
Deidentificat Seturi de date de imagini DICOM cu metadate păstrate – și rapoarte opționale de studiu radiologic – pentru a accelera antrenamentul, validarea și cercetarea clinică a modelelor.
Date de imagistică DICOM create pentru inteligența artificială din lumea reală
Shaip oferă servicii pregătite pentru inteligență artificială Seturi de date de imagistică medicală DICOM conceput pentru a ajuta echipele de inteligență artificială din domeniul sănătății să construiască, să antreneze și să valideze modele robuste pentru diagnostic, triaj și suport decizional - utilizând date anonimizate care păstrează valoarea clinică.
Instantaneu al setului de date
- Studii totale:10M +
- Principalele zone geografice (conform studiilor): SUA, Brazilia și India
- Modalități reprezentate: CR, CT, US, DX, RM, MG, TO, RF, NM, Mamografie
- Părți ale corpului reprezentate: Piept, Abdomen, Cap, Coloană Vertebrală, Gât, Inimă și multe altele
Cazuri comune de utilizare pentru seturile de date de imagini DICOM
Antrenează modele de inteligență artificială pentru imagistica diagnostică
- Detectarea anomaliilor
- Clasificarea Isease
- Scorarea/stadializarea severității
- Prioritizarea triajului
- Susține dezvoltarea multimodală
Validarea și testarea performanței modelului
- Evaluați acuratețea modelului pe populații mai largi
- Performanță de referință pe modalitate/regiunea corpului
- Executați validare externă pentru a reduce supraadaptarea
Îmbunătățiți robustețea modelului pe diferite dispozitive și site-uri
- Testarea generalizării între scanere/furnizori
- Reduceți scăderile de performanță la implementarea în spitale noi
Construiți o inteligență artificială multimodală (imagine + raport radiologic)
- Derivați etichete slabe din limbajul raportului
- Antrenează modele aliniate cu narațiunile raportului
- Construiți un sistem de triaj și suport decizional bazat pe rapoarte
Cercetare clinică și creare de cohorte
- Filtrați cohortele după modalitate/parte a corpului/timp
- Susține studiile retrospective
- Accelerați testarea ipotezelor, menținând în același timp controalele de confidențialitate
Crearea de adnotări și date concrete pentru antrenamentul ML
- Etichete de clasificare
- Cutii de delimitare
- Măști de segmentare
Ce primiți în setul de date de imagini DICOM
1. Date pixel DICOM (imaginile)
Toate imaginile sunt anonimizate la nivel de pixel:
- Textul din imagini este redactat sau pseudonimizat
- Artefacte de „defacing” pot fi introduse atunci când reconstrucția facială este posibilă (de exemplu, CT de înaltă rezoluție).
3. Raport de studiu (opțional, atunci când este disponibil)
Text narativ nestructurat scris de radiolog/medic, cu anonimizare conform principiilor Safe Harbor și cu aceeași abordare de decalare a datei.
2. Metadate DICOM (cu Safe Harbor)
Toate metadatele DICOM standard sunt păstrate pentru livrare, în timp ce identificatorii HIPAA Safe Harbor sunt anonimizați, inclusiv:
- Numele pacientului a fost înlocuit cu ID-ul pacientului
- ID-ul pacientului este hașat criptografic
- Numele instituției a fost înlocuit cu un nume alternativ
- Datele s-au schimbat în decurs de 365 de zile (schimb consecvent la nivel de pacient).
4. Metadate personalizate (valoare adăugată opțională)
Metadatele derivate opționale pot include:
- Vârsta pacientului analizată
- Etichete SNOMED (din raport)
- Entități pozitive (din raport)
- Țara de reședință (de la adresă)
- Rasă imputată / Etnie imputată (câmpuri derivate)
Metode de anonimizare DICOM care pun pe primul loc confidențialitatea
Setul de date utilizează hashing criptografic și pseudonimizare pentru a respecta HIPAA, păstrând în același timp utilitatea clinică și protejând datele sensibile.
Protecție la nivel de pixel
Redactare/pseudonimizare a textului incrustat și ștergerea aspectului atunci când este necesar.
Protecția metadatelor
Identificatorii Safe Harbor sunt anonimizați, în timp ce metadatele DICOM standard sunt păstrate.
Schimbarea datei
Datele sunt decalate într-un interval de 365 de zile, la nivel de pacient, pentru a păstra relațiile temporale între studii.
Pardoseli demografice
Anumite câmpuri sunt plafonate/limitate pentru a reduce riscul de reidentificare (de exemplu, vârsta, greutatea, înălțimea și unele valori legate de etnie).
Nu găsești ceea ce cauți?
Sunt colectate noi seturi de date medicale disponibile pentru toate tipurile de date
Contactați-ne acum pentru a renunța la grijile dvs. de colectare a datelor de formare medicală
Întrebări Frecvente (FAQ)
1. Ce este un set de date de imagini DICOM?
Un set de date de imagini DICOM este o colecție de studii de imagistică medicală stocate în standardul DICOM, inclusiv date despre pixeli și metadate clinice, utilizate în mod obișnuit pentru antrenarea și validarea modelelor de inteligență artificială din domeniul sănătății.
2. Ce este inclus în acest set de date de imagini DICOM?
În funcție de domeniul de aplicare al licențierii, aceasta poate include date de pixeli DICOM, metadate DICOM păstrate (anonymizate), rapoarte de studiu opționale și metadate personalizate cu valoare adăugată opționale.
3. Sunt imaginile anonimizate?
Da. Imaginile sunt anonimizate la nivel de pixel, inclusiv prin redactarea/pseudonimizarea textului din imagini și prin modificarea aspectului atunci când este necesar.
4. Sunt metadatele DICOM păstrate?
Metadatele DICOM standard sunt păstrate pentru livrare, în timp ce identificatorii HIPAA Safe Harbor sunt anonimizați (de exemplu, identificatorii și datele pacientului/instituției).
5. Cum sunt gestionate datele?
Datele pot fi modificate în termen de 365 de zile, aplicându-se în mod consecvent la nivel de pacient pentru a păstra sincronizarea relativă între studii.
6. Sunt incluse rapoartele de radiologie/studii?
Atunci când sunt disponibile și licențiate, pot fi incluse rapoarte de studiu (text narativ nestructurat), cu identificatori pseudonimizați.
7. Ce metadate personalizate pot fi disponibile?
Opțiunile pot include vârsta analizată a pacientului, etichete SNOMED, entități pozitive, țara de reședință și alte câmpuri derivate.
8. Pot solicita o anumită cohortă (modalitate, parte a corpului, zonă geografică etc.)?
Da — partajați domeniul de aplicare țintă și filtrele, iar Shaip va propune cea mai potrivită porțiune de seturi de date în funcție de disponibilitate.
9. Cum obțin licență pentru setul de date?
Trimiteți cerințele dumneavoastră prin intermediul formularului de contact. Echipa noastră va confirma disponibilitatea, domeniul de aplicare, termenii de licențiere și opțiunile de livrare.