13 februari 2020

Algoritm lär sig diagnostisera genetisk sjukdom

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

Forskare har hittat ett sätt att använda maskininlärning för att diagnostisera patienter med förhöjda kolesterolnivåer. Algoritmen som tränats med patientdata kan uppskatta sannolikheten för om en patient lider av Familial hypercholesterolemia, en vanlig genetisk sjukdom, eller inte.

Familial hypercholesterolemia (FH) är en vanlig genetisk sjukdom som drabbar en av 250 personer. Sjukdomen påverkar ämnesomsättningen och orsakar förhöjda kolesterolnivåer. För att få en helt säker diagnos krävs ett genetiskt test.

Dessa tester är emellertid bara tillgängliga på ett begränsat antal universitetssjukhus. Alla andra sjukhus använder en metod som kallas Dutch lipid score, som baseras på en patients kliniska egenskaper och familjehistoria. Metoden uppskattar sannolikheten för att en patient lider av FH, snarare än att diagnostisera, och den är ett mer lättillgängligt, men mindre exakt, verktyg än ett genetiskt test.

Uppfunnit ny och mer tillförlitlig diagnosmetod

Nu har en tvärvetenskaplig grupp forskare från institutionen för fysik och avdelningen för molekylär och klinisk medicin vid Göteborgs universitet uppfunnit en alternativ metod.

– Vi bestämde oss för att försöka använda maskininlärning för att förutsäga om en patient har den ärftliga genetiska sjukdomen, eller om deras symptom uppstått av orsaker relaterade till livsstil. För att göra detta använde vi tre olika typer av algoritmer: ett klassificeringsträd, en gradient boosting machine och ett neuralt nätverk. Vi fann att alla tre varianter gav bättre resultat än den traditionella Dutch lipid score, säger Saga Helgadottir, doktorand vid institutionen för fysik.

Använde data från patienter

Forskarna använde data från patienter i Göteborg för att träna algoritmerna. Hälften av datasetet användes för information, den andra hälften för att testa och se hur exakt algoritmerna kunde förutsäga om en patient led av FH eller inte.

För varje patient matades det in ett par grundläggande variabler, som alla sjukhus enkelt kunde få fram, som ålder och resultat från blodprov. Forskarna testade dessutom algoritmerna som tränats med Göteborgs-data på en annan uppsättning data från en liknande patientgrupp från Milano. Resultaten visade att algoritmerna presterade mer exakt när de tränats med ”lokalt data”, men algoritmernas resultat överträffade fortfarande Dutch lipid score när de testade extern Milano-data.

– Beroende på hur väl du tränar algoritmen blir testresultatet mer eller mindre exakt. Sjukhus runt om i världen skulle kunna välja mellan att träna algoritmen med egen patientdata och få ett mer exakt resultat, eller att använda en redan tränad algoritm och fortfarande få ett bättre resultat än i dagsläget, förklarar Saga Helgadottir.

Jämföra data en väg framåt

Framöver kan en potentiell väg att utforska vara att träna algoritmen med hjälp av en stor mängd data från patientgrupper i olika länder, och jämföra exaktheten i resultaten med den för en version som tränats med endast lokala data.

– Möjligheten att testa den idén hänger på tillgången till sådana datamängder, säger Saga Helgadottir.