Îmbunătățirea cercetării NLP oncologice

Precizia datelor oncologice: licențiere, de-identificare și adnotare pentru inovarea modelului NLP

Oncologie nlp

Revoluționăm îngrijirea cancerului cu tehnologii de ultimă oră NLP

Clientul, un jucător important în industria sănătății, a avut nevoie de o soluție avansată NLP pentru a procesa un volum substanțial de dosare medicale oncologice. Ca parte a unei inițiative esențiale de rafinare a cercetării oncologice, necesitatea de a echilibra analiza detaliată a datelor cu standarde stricte de confidențialitate este primordială. Acest studiu de caz subliniază contribuțiile noastre la îmbunătățirea eforturilor de cercetare ale clientului prin adnotarea datelor de înaltă fidelitate, practici riguroase de de-identificare și aplicarea tehnicilor de procesare a limbajului natural (NLP), toate în cadrul de reglementare oferit de HIPAA.

Volum

Licențiere de date + De-id
10 pagini
Relații de oncologie
10 pagini
Domeniul non-oncologic
10 pagini
Negare
10 pagini
Domeniul Oncologie
10 pagini
NER + Maparea relațiilor
10 pagini

Provocări

Proiectul a necesitat o înțelegere nuanțată a documentației clinice, identificarea precisă a entităților medicale și capacitatea de a aplica cu acuratețe etichetele de negație, toate într-un cadru sigur care protejează confidențialitatea pacienților în conformitate cu reglementările HIPAA. Efortul a cerut nu numai expertiză tehnică în manipularea unor volume mari de date complexe, ci și o abordare strategică pentru a încorpora feedback-ul și a menține calitatea în toate etapele procesului de adnotare.

Obiective

Descrierea detaliată a serviciilor

CategoriiDescriere
Acoperire cuprinzătoare a datelor cliniceCuprinzând diferite tipuri de note, setări de îngrijire și subspecialități oncologice, asigurând un set de date robust care reflectă diverse scenarii clinice.
De-identificare riguroasăAsigurarea că toate înregistrările etichetate sunt de-identificate în conformitate cu metoda Safe Harbor a HIPAA, asigurând încrederea clienților în confidențialitatea și securitatea datelor.
Ghid de adnotareCrearea și implementarea ghidurilor standard de adnotare a datelor pentru pregătirea înregistrărilor etichetate în conformitate cu standardele HIPAA.
Strategii avansate de adnotareAdnotarea manuală a 10,000 de pagini de înregistrări legate de oncologie a fost efectuată cu un accent detaliat pe identificarea stărilor de negație și a altor informații pertinente în conformitate cu liniile directoare stabilite.
Asigurare riguroasă a calitățiiAtingeți standardul de calitate specificat subliniat în ghid

Soluţie

Abordarea noastră a implicat următoarele strategii cheie:

Compilare personalizată de set de date oncologice

Dintr-o arhivă vastă de peste 5 MN EHR, a fost extras un subset de date atent ales, menit să răspundă cerințelor de specialitate ale clientului pentru datele oncologice, cu accent pe entitățile genomice. Procesul de colectare a implicat crearea unei liste exhaustive de markeri tumorali, gene, variante și stadii TNM, folosind căutări de cuvinte cheie pentru a identifica documentele abundente în aceste date. Expresiile regulate au fost folosite pentru a identifica o serie de variații genetice și stadii de cancer. Această abordare, combinată cu o acoperire largă de date, care cuprinde diverse tipuri de documente, specialități, setări de îngrijire și date de la mai mulți medici, a asigurat un set de date oncologice cuprinzătoare și relevante.

Compilarea setului de date oncologice

De-identificare riguroasă

Procesul a respectat strict metoda HIPAA Safe Harbor pentru de-identificare, care garantează încrederea clientului în confidențialitatea și securitatea datelor. Aceasta implică eliminarea tuturor informațiilor de sănătate protejate (PHI) și înlocuirea acestora cu substituenți etichetați, menținând astfel utilitatea datelor, protejând în același timp confidențialitatea pacientului.

Variabile de de-identificare

CategoriiSubcategorii
Nume si PrenumeNumele pacientului, numele medicului, numele asistentei medicale, numele membrului familiei, numele centrului medical, numele clinicii, numele casei de bătrâni, numele companiei, numele universității
Vârstă 
DataModel data, model luna an, model zi luna, model zi an, zi, luna, an, anotimp
LocațieȚară, Stat, Oraș, Stradă, Cod poștal, Număr cameră, Număr apartament, Număr etaj
IDNumăr de securitate socială, Număr de fișă medicală, Număr beneficiar al planului de sănătate, Număr de cont, Număr de certificat/licență, Id biometric, Id de înregistrare, Număr de acces, Număr de identificare a vehiculului, Număr plăcuță de înmatriculare Identificatori dispozitiv și număr de serie
ContactNumăr de telefon, Număr de fax, Adresă de e-mail, URL Web, Adresă IP

Exemplu:

Pe 25 septembrie 2106, la ora 11:00, domnul Harry Pace, în vârstă de 90 de ani, a fost internat la Spitalul General Forrest pentru o intervenție chirurgicală programată la șold, consultat anterior de medicul său primar, Dr. Jose Martin, și asistat de Kendra Reith, MD. În timpul șederii sale, el a fost sub îngrijirea lui Mary Hu, NP, și Suzan Ray, RN, cu R. Charles Melancon, PA, fiind de asemenea consultat. Operația sa, efectuată în aceeași zi cu internarea, a avut succes fără complicații raportate. În urma intervenției chirurgicale, domnul Pace a fost transferat în Camera 202, Etajul 2, pentru recuperare. Soția sa, Emma Pace, a fost prezentă pe tot parcursul și a primit toate actualizările necesare. În timpul scurtei sale șederi, dosarele sale medicale, inclusiv MRN MR99062619 și contul KV000014764, au fost gestionate conform protocoalelor standard ale Gracewood Nursing Home, reședința sa anterioară. El a fost externat mai târziu în aceeași zi la îngrijirea Ambulatoriului Oakland pentru recuperare ulterioară. Pe parcursul procesului, toate procedurile au fost documentate și securizate cu respectarea standardelor de confidențialitate.

Exemplu: De-identificat

On [Model de dată], la ora 11:00, dl. [Numele pacientului], în vârstă de [Vârstă], a fost admis [Numele centrului medical] pentru o intervenție chirurgicală programată la șold, consultată anterior de medicul său primar Dr. [Numele medicului], și la care a participat [Numele medicului] MD. În timpul șederii, a fost în îngrijire [Asistenta medicala], NP, și [Asistenta medicala], RN, cu [Numele medicului], PA, fiind de asemenea consultat. Operația sa, efectuată în aceeași zi cu internarea, a avut succes fără complicații raportate. În urma intervenției chirurgicale, dl. [Numele pacientului] a fost transferat în Camera nr. [Numărul de cameră], Etajul nr. [Numărul etajului], pentru recuperare. Soția sa, [Numele membrului de familie], a fost prezentă pe tot parcursul și a primit toate actualizările necesare. În timpul scurtei sale șederi, fișele sale medicale, inclusiv MRN [Numărul de înregistrare medicală] și Cont [Numărul de cont], au fost manipulate conform protocoalelor standard ale [Numele azilului de bătrâni], resedinta lui anterioară. El a fost externat mai târziu în aceeași zi, la îngrijirea lui [Numele clinicii] pentru recuperare ulterioară. Pe parcursul procesului, toate procedurile au fost documentate și securizate cu respectarea standardelor de confidențialitate.

Ghid de adnotare și tehnici avansate de adnotare

Shaip a jucat un rol esențial în stabilirea și implementarea liniilor directoare standard de adnotare a datelor, a asigurat că toate înregistrările etichetate au fost pregătite în mod consecvent și în conformitate cu standardele HIPAA. Mai mult, 10,000 de pagini din diferite dosare medicale au fost adnotate meticulos, cu accent pe etichetarea detaliată a stărilor de negație și a altor entități relevante clinic, inclusiv diferite subspecialități oncologice. Adnotările au fost realizate de o echipă de adnotatori experți cu cunoștințe de specialitate în oncologie și reglementări privind confidențialitatea datelor.

Criterii de adnotare complexe

CategoriiSubcategorii
Adnotare dată (oncologie)Data diagnosticului, data etapei, debutul, data procedurii, data începerii medie, data încheierii medie, data începerii radiației, data încheierii radiației
Boală (oncologie)Problemă cancerului, histologie, stare clinică, locul corpului, comportament, grad, stadiu de cancer, stadiu TNM, test marker tumoral, dimensiuni, cod
Tratament (oncologie)Medicina cancerului, dozarea medicamentelor, frecvența, chirurgia cancerului, rezultatul intervenției chirurgicale, modalitatea de radiație, doza de radiații
GenomicaCod de variație, genă studiată, metodă, specimen
NegareNegativ, Posibil Negativ, Nesigur, Posibil Pozitiv
NER clinicăProblema cancerului – Locul corpului, Histologie – Locul corpului, Comportamentul – Locul corpului, Chirurgia cancerului – Relații Locul corpului, Modalitatea radiației – Locul corpului, Histologia – Gradul, Problema cancerului – Dimensiunea

Exemplu:

Nota clinica oncologica

Nota clinica oncologica

„Pacienta Jane Doe a fost diagnosticată cu cancer pulmonar fără celule mici (NSCLC) în stadiul IIIB, în special adenocarcinom, la 03. Cancerul este localizat în lobul inferior drept al plămânului. Este clasificat ca T05N2023M3 conform sistemului de stadializare TNM, cu o dimensiune a tumorii de 2 cm x 0 cm. O deleție a exonului 5 EGFR a fost identificată prin analiza PCR a specimenului de biopsie tumorală. Chimioterapia cu carboplatină ASC 3 și pemetrexed 19 mg/m² a fost inițiată la 5 și urmează să fie administrată la fiecare 500 săptămâni. Radioterapia cu fascicul extern (EBRT) la o doză de 03 Gy în 20 de fracții a început la 2023. Tratamentul pacientului este în curs de desfășurare și nu există dovezi de metastaze cerebrale la RMN recent. Posibilitatea invaziei limfovasculare nu a fost încă determinată, iar toleranța pacientului pentru regimul complet de chimioterapie rămâne incertă.

Nota clinica oncologica

Nota clinica oncologica

Asigurare riguroasă a calității

Implementarea unui cadru flexibil de management de proiect care a facilitat integrarea eficientă a feedback-ului clienților, respectând în același timp standarde stricte de calitate. A fost implementat un protocol cuprinzător de asigurare a calității, aliniat la liniile directoare pentru a atinge criteriile de referință necesare. Acest protocol a prezentat runde succesive de revizuire și verificare, asigurând precizia și fiabilitatea datelor adnotate. O astfel de supraveghere meticuloasă a calității este crucială în elaborarea unei soluții NLP de încredere, vitală pentru luarea deciziilor clinice informate și excelența în cercetare.

Rezultat

S-au livrat cu succes 10,000 de înregistrări de înaltă calitate, etichetate neidentificate, oferind un set de date sigur și valoros pentru dezvoltarea modelului NLP al clientului. Aplicarea meticuloasă a NLP și aderarea la standardele de de-identificare HIPAA au dus la un set de date extrem de rafinat care va sprijini eforturile de cercetare oncologică în curs și viitoare ale clientului, urmărind în cele din urmă să îmbunătățească rezultatele pacienților oncologici și eficiența furnizării de îngrijiri.

Succesul proiectului ilustrează capacitatea noastră de a gestiona cu precizie date medicale complexe, contribuind la scopul clientului de a îmbunătăți rezultatele îngrijirii pacienților și de a accelera ritmul inovației în domeniul sănătății.

Parteneriatul nostru cu Shaip a fost esențial în dezvoltarea capacităților noastre NLP în domeniul oncologiei. Manipularea profesională a 10,000 de fișe medicale, adnotate cu negații detaliate și alte entități clinice, a demonstrat angajamentul lor față de excelență și conformitate. Mai mult, angajamentul lor față de standardele de confidențialitate precum HIPAA ne-a oferit resurse neprețuite pentru a ne impulsiona inițiativele AI de a dezvolta tratamente și diagnostice oncologice de ultimă oră.

Golden-5-stele

Accelerează-ți AI pentru sănătate
dezvoltarea aplicațiilor cu 100%