Hjälper datorer att bli bättre på att översätta och bearbeta texter
Internet flödar av information, på en mängd olika språk. Våra språkkunskaper och vår tid begränsar möjligheten att ta del av allt vi önskar. Vi kan ta datorer till hjälp för att ta in informationen automatiskt för översättning och bearbetning, bland annat med hjälp av en syntaktisk analysator, men resultatet blir sällan lika bra som om en mänsklig hjärna gjort jobbet.
I en ny doktorsavhandling från Växjö universitet presenterar Jens Nilsson tekniker för att förbättra syntaktiska analysatorer för mer än tio naturliga språk, såsom tjeckiska, arabiska och kinesiska.
En syntaktisk analysator kan användas som en del i ett större system för automatisk översättning från ett språk till ett annat, för att automatiskt besvara frågor på naturligt språk, eller för att utvinna information ur stora mängder text.
En syntaktisk analysator bygger upp en syntaktisk struktur i meningar, dvs. den förklarar hur orden i meningen hänger ihop syntaktiskt. Analysatorerna som används i denna avhandling utför i princip en satsanalys i alla meningar den bearbetar.
Att förmå en dator identifiera satsdelar är svårt för datorer. De metoder som Jens Nilsson utvecklat kan användas för att göra jobbet för maskininläraren lättare, vilket i sin tur förbättrar den syntaktiska analysen. Vidare undersöks olika metoder för att analysera samma mening med flera olika syntaktiska analysatorer och därefter slå ihop de olika analyserna till en enda.
Motiveringen är att olika syntaktiska analysatorer är bra på olika saker; vissa syntaktiska analysatorer kan exempelvis vara bättre på att identifiera subjekt men sämre på predikat, och vice versa. Metoderna som presenteras i avhandlingen utnyttjar deras starka sidor och kompenserar deras svagare, vilket leder till en ännu bättre syntaktisk analys.
Jens Nilsson har utvecklat programvara som innehåller de metoder som presenteras i avhandlingen.
Programvaran för de bästa metoderna i avhandlingen är en del av ett större system för syntaktisk analys, MaltParser. MaltParser är utvecklat av gruppen för språkteknologi vid Växjö universitet, i vilken Jens ingår.
Gruppen har tillsammans deltagit i flera internationella utvärderingar med MaltParser. I konkurrens med forskargrupper från välkända amerikanska universitet och företag rankas MaltParser som ett av de allra främsta systemen i världen.
Jens kommer ursprungligen från Växjö och bor numera i Hovmantorp. Han började studera på grundutbildningen i datavetenskap vid Växjö universitet 1998 och påbörjade 2005 sin forskarutbildning inom datavetenskap med särskild inriktning mot språkteknologi.
Avhandlingen ”Transformation and Combination in Data-Driven Dependency Parsing” försvaras fredagen den 16 oktober, kl. 13.15. Disputationen äger rum i Weber, Växjö universitet. Opponent är Ph D Ryan McDonald, Google Research, New York.
För mer information kontakta Jens Nilsson, telefon 0470-70 89 66, 0730-641515 e-post: jens.nilsson@vxu.se. Beställ boken av Kerstin Brodén, Växjö University Press, telefon 0470-70 82 67 eller e-post: vup@vxu.se