Tema

Lexikalisk information med hjälp av dator

Lexical Knowledge Acquisition (LKA) är ett utmanande och komplext område som har uppmärksammats inom språkteknologin. Språkteknologi är ett växande forskningsfält som syftar till att öka kunskapen om hur man utvecklar IT-system baserade på förståelse av språkliga processer och utveckla teknologier för datorbehandling av svenska och andra språk i tal och skrift. Målet med Dimitrios Kokkinakis avhandling är att automatiskt utvinna lexikalisk-semantisk information från texter samt hitta, undersöka och beskriva lämpliga metoder för att åstadkomma detta.

LKA är en uppgift som en dator utför när lexikalisk information för textuella enheter som ord eller fraser extraheras från en informationskälla, t. ex. maskinläsbara texter eller ordböcker. Informationen skall användas i datorsystem, som t. ex. system som översätter från ett språk till ett annat eller system som kvalitativt och kvantitativt förbättrar ordböcker. De tillämpningar som kan dra nytta av ett sådant arbete har ett behov av bra beskrivningar av hur ord som verb och adjektiv konstrueras, vilka satsdelar de kan kombineras med, vilka egenskaper de har, hur detta manifesteras i texten och hur vi kan dela in dessa ord utifrån all den information man lyckas hämta ifrån texterna.

Dimitrios Kokkinakis har använt ett modulariserat arbetssätt. Han har skapat ett datorsystem där olika beståndsdelar ingår som självständiga moduler som samverkar med varandra. Modulerna har som gemensamt mål att extrahera olika typer av information, nödvändig för de abstraktioner och generaliseringar som de textuella enheterna kräver. Hela arkitekturen kan betraktas som ett stort pussel, där olika moduler kan bidra med egna konkreta bitar. Modulerna är uppdelade i förprocesserings-, annoterings- och analysmoduler. En del av avhandlingen avser att beskriva dessa moduler samt bidra med att påvisa den praktiska användningen som automatisk utvinning av lexikalisk information kan innebära för ordboksarbete och språkteknologi.

Avhandlingens titel: A Framework for the Acquisition of Lexical Knowledge. Description and Applications. (Ett system för utvinning av lexikalisk information; beskrivning och tillämpningar.) Disputationen äger rum lördagen den 15 december 2001 kl. 10, Lilla hörsalen, Humanisten, Renströmsgatan 6, Göteborg. Närmare upplysningar kan fås av Dimitrios Kokkinakis, tel. 031-773 5281 (arb.), e-post: svedk@hum.gu.se, hemsida: http://svenska.gu.se/~svedk/

Lexikalisk information med hjälp av dator

 lästid ~ 1 min