Precizia datelor oncologice: licențiere, de-identificare și adnotare pentru inovarea modelului NLP
Revoluționăm îngrijirea cancerului cu tehnologii de ultimă oră NLP.
rezumatul proiectului
Clientul, un jucător important în industria sănătății, a avut nevoie de o soluție avansată NLP pentru a procesa un volum substanțial de dosare medicale oncologice. Ca parte a unei inițiative esențiale de rafinare a cercetării oncologice, necesitatea de a echilibra analiza detaliată a datelor cu standarde stricte de confidențialitate este primordială. Acest studiu de caz subliniază contribuțiile noastre la îmbunătățirea eforturilor de cercetare ale clientului prin adnotarea datelor de înaltă fidelitate, practici riguroase de de-identificare și aplicarea tehnicilor de procesare a limbajului natural (NLP), toate în cadrul de reglementare oferit de HIPAA.

Statistici cheie
Licențierea datelor
+ Data De-id
10,000 pagini
Non-oncologie
domeniu
10,000 pagini
Oncologie
domeniu
10,000 pagini
Oncologie
Relaţii
4500 pagini
Negare
9000 pagini
NER + Relație
Maparea
1223 pagini
Provocări
Proiectul a necesitat o înțelegere nuanțată a documentației clinice, identificarea precisă a entităților medicale și capacitatea de a aplica cu acuratețe etichetele de negație, toate într-un cadru sigur care protejează confidențialitatea pacienților în conformitate cu reglementările HIPAA. Efortul a cerut nu numai expertiză tehnică în manipularea unor volume mari de date complexe, ci și o abordare strategică pentru a încorpora feedback-ul și a menține calitatea în toate etapele procesului de adnotare.
Descrierea detaliată a serviciilor:
- Acoperire cuprinzătoare a datelor clinice: Cuprinzând diferite tipuri de note, setări de îngrijire și subspecialități oncologice, asigurând un set de date robust care reflectă diverse scenarii clinice.
- De-identificare riguroasă: Asigurarea că toate înregistrările etichetate sunt de-identificate în conformitate cu metoda Safe Harbor a HIPAA, asigurând încrederea clienților în confidențialitatea și securitatea datelor.
- Ghid pentru adnotare: Crearea și implementarea ghidurilor standard de adnotare a datelor pentru pregătirea înregistrărilor etichetate în conformitate cu standardele HIPAA.
- Tehnici avansate de adnotare: Aplicarea NLP la 10,000 de pagini de înregistrări legate de oncologie, care implică etichetarea complicată a stărilor de negație și alte detalii relevante conform ghidurilor stabilite anterior.
- Asigurare riguroasă a calității: Atingeți standardul de calitate specificat subliniat în ghid.
Soluţie
Abordarea noastră a implicat următoarele strategii cheie:
Acoperire cuprinzătoare a datelor clinice
Pentru a adapta setul de date la nevoile specifice ale clientului, o selecție țintită de date a fost extrasă cu meticulozitate din depozitul extins Shaip de peste 5 milioane de evidențe medicale electronice. Acest set de date organizat a cuprins o varietate de tipuri de note și setări de îngrijire, oferind o varietate bogată și diversă
spectrul de scenarii clinice. Acest lucru asigură un set de date care nu este doar cuprinzător, ci și foarte reprezentativ pentru datele medicale din lumea reală.
De-identificare riguroasă
Procesul a respectat strict metoda HIPAA Safe Harbor pentru de-identificare, care garantează încrederea clientului în confidențialitatea și securitatea datelor. Aceasta implică eliminarea tuturor informațiilor de sănătate protejate (PHI) și înlocuirea acestora cu substituenți etichetați, menținând astfel utilitatea datelor, protejând în același timp confidențialitatea pacientului.
Variabile de de-identificare
Categorii | Subcategorii |
---|---|
Nume | Numele pacientului, numele medicului, numele asistentei medicale, numele membrului familiei, numele centrului medical, numele clinicii, numele casei de bătrâni, numele companiei, numele universității |
Vârstă | |
Data | Model data, model luna an, model zi luna, model zi an, zi, luna, an, anotimp |
Locație | Țară, Stat, Oraș, Stradă, Cod poștal, Număr cameră, Număr apartament, Număr etaj |
ID | Număr de securitate socială, Număr de fișă medicală, Număr de beneficiar al planului de sănătate, Număr de cont, Număr de certificat/licență, Id biometric, Id de înregistrare, Număr de acces, Număr de identificare a vehiculului, Număr plăcuță de înmatriculare Identificatori dispozitiv și număr de serie |
Contact | Număr de telefon, Număr de fax, Adresă de e-mail, URL Web, Adresă IP |
Exemplu:
Pe 25 septembrie 2106, la ora 11:00, domnul Harry Pace, în vârstă de 90 de ani, a fost internat la Spitalul General Forrest pentru o intervenție chirurgicală programată la șold, consultat anterior de medicul său primar, Dr. Jose Martin, și asistat de Kendra Reith, MD. În timpul șederii sale, el a fost sub îngrijirea lui Mary Hu, NP, și Suzan Ray, RN, cu R. Charles Melancon, PA, fiind de asemenea consultat. Operația sa, efectuată în aceeași zi cu internarea, a avut succes fără complicații raportate. În urma intervenției chirurgicale, domnul Pace a fost transferat în Camera 202, Etajul 2, pentru recuperare. Soția sa, Emma Pace, a fost prezentă pe tot parcursul și a primit toate actualizările necesare. În timpul scurtei sale șederi, dosarele sale medicale, inclusiv MRN MR99062619 și contul KV000014764, au fost gestionate conform protocoalelor standard ale Gracewood Nursing Home, reședința sa anterioară. El a fost externat mai târziu în aceeași zi la îngrijirea Ambulatoriului Oakland pentru recuperare ulterioară. Pe parcursul procesului, toate procedurile au fost documentate și securizate cu respectarea standardelor de confidențialitate.
Exemplu: De-identificat
On [Model de dată], la ora 11:00, dl. [Numele pacientului], în vârstă [Vârstă], a fost admis [Numele centrului medical] pentru o intervenție chirurgicală programată la șold, consultată anterior de medicul său primar Dr. [Numele medicului], și la care a participat [Numele medicului] MD. În timpul șederii, a fost în îngrijire [Asistent medical], NP și [Asistent medical], RN, cu [Numele medicului], PA, fiind de asemenea consultat. Operația sa, efectuată în aceeași zi cu internarea, a avut succes fără complicații raportate. În urma intervenției chirurgicale, dl. [Numele pacientului] a fost transferat în Camera nr. [Numărul camerei], Etajul nr. [Numărul etajului], pentru recuperare. sotia lui, [Numele membrului de familie], a fost prezent pe tot parcursul și a primit toate actualizările necesare. În timpul scurtei sale șederi, fișele sale medicale, inclusiv MRN [Numărul de înregistrare medicală] și Cont [Numărul de cont], au fost manipulate conform protocoalelor standard ale [Numele azilului de bătrâni], reședința sa anterioară. El a fost externat mai târziu în aceeași zi, la îngrijirea lui [Numele clinicii] pentru recuperare ulterioară. Pe parcursul procesului, toate procedurile au fost documentate și securizate cu respectarea standardelor de confidențialitate.
Ghid de adnotare și tehnici avansate de adnotare
Shaip a jucat un rol esențial în stabilirea și implementarea liniilor directoare standard de adnotare a datelor, a asigurat că toate înregistrările etichetate au fost pregătite în mod consecvent și în conformitate cu standardele HIPAA. Mai mult, 10,000 de pagini din diverse fișe medicale au fost meticulos adnotate, cu
un accent pe etichetarea detaliată a stărilor de negație și a altor entități relevante clinic, inclusiv diferite subspecialități de oncologie. Adnotările au fost realizate de o echipă de adnotatori experți cu cunoștințe de specialitate în oncologie și reglementări privind confidențialitatea datelor.
Adnotare complexă
Categorii | Subcategorii |
---|---|
Data adnotare (Oncologie) | Data diagnosticului, Data etapei, Debutul, Data procedurii, Data începerii medie, Data încheierii medie, Data începerii radiației, data încheierii radiației |
Boală (Oncologie) | Problemă cancerului, histologie, stare clinică, locul corpului, comportament, grad, stadiu de cancer, stadiu TNM, test marker tumoral, dimensiuni, cod |
Tratare (Oncologie) | Medicina cancerului, dozarea medicamentelor, frecvența, chirurgia cancerului, rezultatul intervenției chirurgicale, modalitatea de radiație, doza de radiații |
Genomica | Cod de variație, genă studiată, metodă, specimen |
Negare | Negativ, Posibil Negativ, Nesigur, Posibil Pozitiv |
NER clinică Relaţii | Problema cancerului – Locul corpului, Histologie – Locul corpului, Comportamentul – Locul corpului, Chirurgia cancerului – Locul corpului, Modalitatea radiației – Locul corpului, Histologia – Gradul, Problema cancerului – Dimensiunea |
Exemplu:
Nota clinica oncologica
„Pacienta Jane Doe a fost diagnosticată cu cancer pulmonar fără celule mici (NSCLC) în stadiul IIIB, în special adenocarcinom, la 03. Cancerul este localizat în lobul inferior drept al plămânului. Este clasificat ca T05N2023M3 conform sistemului de stadializare TNM, cu o dimensiune a tumorii de 2 cm x 0 cm. O deleție a exonului 5 EGFR a fost identificată prin analiza PCR a specimenului de biopsie tumorală. Chimioterapia cu carboplatină ASC 3 și pemetrexed 19 mg/m² a fost inițiată la 5 și urmează să fie administrată la fiecare 500 săptămâni. Radioterapia cu fascicul extern (EBRT) la o doză de 03 Gy în 20 de fracții a început la 2023. Tratamentul pacientului este în curs de desfășurare și nu există dovezi de metastaze cerebrale la RMN recent. Posibilitatea invaziei limfovasculare nu a fost încă determinată, iar toleranța pacientului pentru regimul complet de chimioterapie rămâne incertă.
Declarație clinică de oncologie:
Asigurare riguroasă a calității
Am implementat un cadru flexibil de management de proiect care a facilitat integrarea eficientă a feedback-ului clienților, respectând în același timp standarde stricte de calitate. A fost implementat un protocol cuprinzător de asigurare a calității, aliniat la liniile directoare pentru a atinge criteriile de referință necesare. Acest protocol a prezentat runde succesive de revizuire și verificare, asigurând precizia și fiabilitatea datelor adnotate. O astfel de supraveghere meticuloasă a calității este crucială în elaborarea unei soluții NLP de încredere, vitală pentru luarea deciziilor clinice informate și excelența în cercetare.
Rezultat
S-au livrat cu succes 10,000 de înregistrări de înaltă calitate, etichetate neidentificate, oferind un set de date sigur și valoros pentru dezvoltarea modelului NLP al clientului. Aplicarea meticuloasă a NLP și aderarea la standardele de de-identificare HIPAA au dus la un set de date extrem de rafinat care va sprijini eforturile de cercetare oncologică în curs și viitoare ale clientului, urmărind în cele din urmă să îmbunătățească rezultatele pacienților oncologici și eficiența furnizării de îngrijiri.
Succesul proiectului ilustrează capacitatea noastră de a gestiona cu precizie date medicale complexe, contribuind la scopul clientului de a îmbunătăți rezultatele îngrijirii pacienților și de a accelera ritmul inovației în domeniul sănătății.
Parteneriatul nostru cu Shaip a fost esențial în dezvoltarea capacităților noastre NLP în domeniul oncologiei. Manipularea profesională a 10,000 de fișe medicale, adnotate cu negații detaliate și alte entități clinice, a demonstrat angajamentul lor față de excelență și conformitate. Mai mult, angajamentul lor față de standardele de confidențialitate precum HIPAA ne-a oferit resurse neprețuite pentru a ne impulsiona inițiativele AI de a dezvolta tratamente și diagnostice oncologice de ultimă oră.