hh.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Leveraging LLMs for ICD Coding and Uncertainty Estimation: Can the model's awareness of the hierarchical structureof ICD-10 codes impact its prediction performance?
Högskolan i Halmstad, Akademin för informationsteknologi.
2025 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

Manual ICD coding of clinical notes with International Classificationof Diseases (ICD) codes is a time-consuming and error-prone task,yet critical for effective healthcare management, billing, and research.This thesis investigates the use of Large Language Models (LLMs) toautomate the prediction and assignment of ICD codes from clinicalnotes, aiming to enhance both the efficiency and accuracy of the pro-cess while reducing the reliance on human coders.We developed a novel approach to leverage the hierarchical struc-ture of ICD codes, which reflects the nested and interrelated natureof diagnoses, to improve the predictive capabilities of LLMs. By incor-porating this hierarchical awareness, the model is better equipped tocapture the dependencies among medical codes, thereby minimizingerrors associated with irrelevant or less likely disease classifications.Additionally, we implemented uncertainty estimation techniquesduring the inference phase to assess the confidence of the model’spredictions. By quantifying prediction uncertainty, we can identifycases where the model may be less certain, providing valuable in-sights into areas where human oversight might still be necessary.Our results show that integrating hierarchical structures reducesthe likelihood of predicting irrelevant diseases that are distant fromthe actual disease in the hierarchical tree, highlighting the potentialof this approach to improve ICD code assignment

Ort, förlag, år, upplaga, sidor
2025.
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:hh:diva-55372OAI: oai:DiVA.org:hh-55372DiVA, id: diva2:1933618
Utbildningsprogram
Masterprogram i informationsteknologi
Examinatorer
Tillgänglig från: 2025-01-31 Skapad: 2025-01-31 Senast uppdaterad: 2025-10-01Bibliografiskt granskad

Open Access i DiVA

fulltext(1342 kB)505 nedladdningar
Filinformation
Filnamn FULLTEXT02.pdfFilstorlek 1342 kBChecksumma SHA-512
fdc061d5175cd7b8c58d37388e3881a6a573d9b04777c14e2a143e66ecea26c4f2fd5459caee41271ac751dd68907e538151dfde705e9c7f82d7d84643e6af30
Typ fulltextMimetyp application/pdf

Av organisationen
Akademin för informationsteknologi
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 506 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 982 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf