Artikel från Umeå universitet

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

21 maj 2008

Släktforskning bland proteiner – nu också på Internet

Jeanette Tångrot, Umeå universitet, har i sin avhandling undersökt metoder för att förutsäga släktskap mellan olika proteiner. Hon har bland annat utvecklat en databas som gör det möjligt att ta reda på vilken familj ett intressant protein tillhör.

Bioinformatik är ett område där datavetenskapliga och statistiska metoder används för att analysera och strukturera biologiska data. Ett viktigt område inom bioinformatiken försöker förutsäga vilken tredimensionell struktur och funktion ett protein har, utifrån dess aminosyrasekvens och/eller likheter med andra, redan karaktäriserade, proteiner. Det är känt att två proteiner med likande aminosyrasekvenser också har liknande tredimensionella strukturer.

Att två proteiner har liknande strukturer behöver dock inte betyda att deras sekvenser är lika, vilket kan göra det svårt att hitta strukturella likheter utifrån ett proteins aminosyrasekvens.

Jeanette Tångrot beskriver i sin avhandling två metoder för att hitta likheter mellan proteiner. Den ena metoden fokuserar på att bestämma vilken familj av proteindomäner, med känd 3D-struktur, en given sekvens tillhör. Den andra försöker förutsäga ett proteins veckning, d.v.s. ge en grov bild av proteinets struktur.

Båda metoderna använder s.k. dolda Markov-modeller (hidden Markov models, HMMer), en statistisk metod som bland annat kan användas för att beskriva proteinfamiljer. Med hjälp en HMM kan man förutsäga om en viss proteinsekvens tillhör den familj modellen representerar. Båda metoderna använder också strukturinformation för att öka modellernas förmåga att känna igen besläktade sekvenser, men på olika sätt.

Den första metoden kan hitta rätt familj till en hög andel av de testade sekvenserna, med nästan inga fel. Den är också bättre än en idag ofta använd metod när det gäller att hitta rätt familj till helt nya proteinsekvenser. Den metod som Jeanette Tångrot utvecklat finns tillgänglig via Internet och där är det möjligt att ta reda på vilken familj ett intressant protein kan tillhöra, se http://babel.ucmp.umu.se/fish.

Den andra metoden tar hänsyn till både sekvens och sekundärstruktur, vilket är en fördel när det gäller att hitta rätt veckning för en proteinsekvens, både då den riktiga sekundärstrukturen används och då man använder en teoretiskt förutsagd.

Fredagen den 23 maj försvarar Jeanette Tångrot, Institutionen för datavetenskap samt Umeå Centre for Molecular Pathogenesis (UCMP), Umeå universitet, sin avhandling med titeln ”Structural Information and Hidden Markov Models for Biological Sequence Analysis”. Svensk titel: ”Strukturinformation och dolda Markovmodeller för biologisk sekvensanalys”.
Disputationen äger rum kl 10.15 i MA121, MIT-huset. Fakultetsopponent är professor Erik Sonnhammer, Stockholm Bioinformatics Centre, Stockholms universitet.

Kontaktinformation
För ytterligare information, kontakta:
Jeanette Tångrot
Telefon: 090-786 57 59
Epost: jeanette@cs.umu.se

Nyhetsbrev med aktuell forskning

Visste du att robotar som ser en i ögonen är lättare att snacka med? Missa ingen ny forskning, prenumerera på vårt nyhetsbrev!

Jag vill prenumerera