Tema

Medborgarforskare och AI i gigantisk analys av proteiner

Bättre beskrivningar av de hundratusentals mikroskopiska bilder av människans celler och proteiner som finns tillgängliga i databasen Human Protein Atlas. Dessutom har ett antal nya proteiner i den mystiska cellstrukturen Rods & Rings identifierats, med hjälp av medborgarforskning via dataspel. Det är ett av resultaten från ett internationell forskningssamarbete lett från KTH.

I projektet har man använt sig både av dataspel och av artificiell intelligens för att förbättra klassificeringen av proteiner.

– Jag tror att vi kommer se mer integrering av vetenskapliga uppgifter i etablerade dataspel, det är ett attraktivt sätt att komma åt och dra nytta av människors hjärnkapacitet, säger Emma Lundberg, lektor vid Cellulär och Klinisk proteomik på KTH, som samtidigt vill framföra ett stort tack till alla medborgarforskare som deltagit för både deras arbete och upptäckter.

– Dessutom har medborgarforskningsspel som direkt kopplas till modeller för maskininlärning möjlighet att revolutionera analyser i storskaliga forskningsprojekt.

KTH-forskare presenterar två metoder för att klassificera mönster i mikroskopbilder av människans proteiner, i en artikel i Nature Biotechnology. Målet med studien har varit att förbättra annoteringen (definieringen och tolkningen) av människans proteiner, som finns tillgängliga i databasen Human Protein Atlas (HPA).

KTH-forskarna har samarbetat med det schweiziska startuppföretaget Massive Multiplayer Online Science och det isländska spelföretaget CCP Games. Tack vare samarbetet har man kunnat integrera klassificeringen av proteinbilderna som ett medborgarforskningsmoment i EVE Online, ett gigantiskt multiplayer online-spel.

Medborgarforskning i dataspel
Detta resulterade i mini-spelet Project Discovery som spelades av över 300,000 personer på EVE Online och genererade över 33 miljoner klassificeringar av proteinbilder. Det här är första gången som medborgarforskning har implementerats i ett dataspel och det har redan beskrivits som en milstolpe inom medborgarforskningen.

Resultatet av Project Discovery jämfördes med ett system baserat på artificiell intelligens (AI) som forskarna har tagit fram: the Localization Annotation Tool (Loc-CAT). Loc-CAT är den första generaliserbara metoden för att annotera proteiner som finns på flera ställen i cellen (så kallade multilokaliserade proteiner).

Nya proteiner i Rods & Rings
Det kan fungera över många olika celltyper vilket gör det till ett användbart verktyg för att studera människans celler och dess beteende i framtiden. Trots att AI-verktyget var bättre än Project Discovery-spelarna för de vanliga klasserna av proteiner så var spelarna bättre på att identifiera ovanliga och nya mönster. Genom att kombinera Project Discovery-annoteringar med AI kunde en version av Loc-CAT med bättre prestanda tas fram.

Resultaten från denna studie har lett till förfinade annoteringar i cellatlasen i Human Protein Atlas. Dessutom har ett antal nya proteiner i den mystiska cellstrukturen som kallas Rods & Rings identifierats. Resultaten har nu integrerats i HPA-databasen och kommer utgöra en värdefull resurs för forskare över hela världen som vill förstå proteiner.

Vill du bidra till protein-forskningen? Ny bildanalysutmaning öppnar 17 september

För trots detta lyckade projekt finns det fortfarande mycket utrymme för förbättringar, menar Emma Lundberg, lektor vid Cellulär och Klinisk proteomik på KTH.

– Vi kan därför annonsera Human Protein Atlas 2018 Challenge på Kaggle med start 17 september. Det är en öppen bildanalys-utmaning för att klassificera subcellulära proteinmönster i dessa bilder där vinnarna kommer bidra till att hjälpa forskningen inom livsvetenskaperna framåt, säger Emma Lundberg.

Artikeln:
Deep learning is combined with massive-scale citizen science to improve large-scale image classification, Nature Biotechnology.

Kontakt:
Emma Lundberg, emma.lundberg@scilifelab.se

Vi finns där du är @forskningsnyhet

Medborgarforskare och AI i gigantisk analys av proteiner

 lästid ~ 2 min