Adversarial training for diagnosis based on the electrocardiogram : Making deep learning analysis of the electrocardiogram more robust / Motstridig träning för diagnostisering av elektrokardiogram : Ett sätt att göra djupinlärningsanalyser av elektrokardiogram mer robusta
- Authors
- Publication Date
- Jan 01, 2024
- Source
- DiVA - Academic Archive On-line
- Keywords
- Language
- English
- License
- Green
- External links
Abstract
Automated electrocardiogram (ECG) analysis using deep neural networks has seen promising results in recent years in various fields such as arrhythmia diagnosis and mortality prediction through age proxies. However, these deep learning models are susceptible to small indistinguishable perturbations that change the model prediction. These models also perform significantly worse when faced with domain shifts when applied to new data distributions not previously trained on. This thesis investigates how training on worst-case artificial samples through adversarial training can help generate models that can readily be adapted through fine-tuning to new datasets. Investigations are done by conducting robustness and transferability experiments using adversarial training on three different tasks in ECG analysis: atrial fibrillation diagnosis, sex classification, and age prediction. These experiments show that adversarial training creates models that generalize better and can be more efficiently adapted to new datasets with higher performance than non-adversarially trained models. This work thus paves the way for models that perform better on new datasets thus requiring less data for fine-tuning. This enables the use of high-performing models in settings where data is more scarce, thus enabling ECG analysis tools suitable in developing countries and smaller hospitals. The experiments also show that adversarial training improves the robustness of the trained models and that this robustness is retained to a smaller degree when transferred to new settings. This yields models that can withstand smaller directed perturbations without significantly changing their prediction. Thus this work also enables more consistent models, which in turn yields models that are more trustworthy. / Analys av elektrokardiogram (EKG) med hjälp av djupinlärning har sett stora framsteg senaste åren, bland annat vid diagnostik av hjärtarytmi, förutsägande av ålder utifrån EKG samt dödlighetsanalyser via åldersregressioner. Dessa modeller är dock känsliga till algoritmer som introducerar mycket små omärkbara förändringar i indatan som får modellen att ge ett så inkorrekt svar som möjligt. Dessutom preseterar dessutom dessa modeller betydligt sämre när de appliceras i nya miljöer som de inte tränats på. Denna masteruppsats avser därmed undersöka hur träning på artificiell indata genererad genom adversarial attacks, så kallad motstridig träning (eng. adversarial training), kan skapa nya modeller som är så pass allmänna att de motstår både adversarial attacks och effektivt kan appliceras i nya miljöer via finjustering av modellparametrarna. Detta görs genom robusthets- och överförbarhetsexperiment som använder sig av motstridig träning i tre tillämpningsområden för djuplärning inom EKG-analys: diagnos av förmaksflimmer, könsklassificering och åldersregression. Experimenten visar att motstridig träning skapar modeller som generaliserar bättre och som kan anpassas till nya dataset och där prestera bättre än motsvarande vanliga djupinlärningsmodeller. Detta masterarbete främjar därför modeller som presterar bättre på nya dataset och därmed kräver mindre data för finjustering. Detta bidrar därmed till högpresterande modeller i miljöer där data är begränsad. Detta kan i sin tur vara användbart i analys av EKG i utvecklingsländer eller mindre sjukhus där data är betydligt mer svårtillgänglig. Experimenten visar att motstridig träning kraftigt reducerar känsligheten gentemot små, avsiktliga förändringar och därmed skapar robustare modeller och att de även är robustare efter finjustering. Detta skapar modeller som därmed kan motstå små förändringar i indatan utan motsvarande stora förändringar i utdatan. Detta arbete visar därmed hur mer konsekventa modeller kan skapas, vilket i sin tur leder till ökad tillit.