14 juni 2021

När datorer lär sig människospråk måste regler brytas

Artikel från Umeå universitet

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

Datorers styrka ligger i att de alltid följer regler i form av de instruktioner de är programmerade med. Detta är också deras svaghet när det kommer till att bearbeta människors språk, enligt en avhandling vid Umeå universitet.

– Vi människor använder språk på ett inte alltid helt entydigt sätt, men givet sammanhanget tenderar vi att förstå varandra ändå. För en dator är vi dock i grunden helt obegripliga, säger Anna Jonsson, Institutionen för datavetenskap vid Umeå universitet.

Hon fortsätter:

– Ett annat problem är att språk är oändliga, och att en dators minnesutrymme är ändligt. Det vi som jobbar med språkbearbetning gör är att försöka använda det ändliga utrymmet för att täcka en så stor del av ett språk som möjligt.

Datorer kommunicerar via så kallade formella språk – språk som följer ett ändligt antal logiska regler. Trots att människospråk också följer vissa grammatiska regler så är dessa regler föränderliga och inte strikt nödvändiga för att vi ska förstå varandra, vilket ju är målet med mellanmänsklig kommunikation.

Datorn behöver bättre språkanalys

För att en dator ska kunna analysera människors språk behövs ändliga modeller som representerar aspekten som ska analyseras. Två centrala aspekter är syntax och semantik: syntax är orden som används och deras ordning medan semantik avser mening – vad en specifik text vill förmedla. I en dator representeras syntaktiska analyser som datastrukturen träd medan semantiska analyser fångas i form av datastrukturen graf.

Språkanalysmodeller måste också kunna utvärderas. För det behövs data i form av människospråk: med den kan modellens analyser poängsättas genom jämförelse med data. I sin avhandling utvecklar Anna Jonsson en metod som extraherar de högst poängsatta syntaktiska analyserna från en existerande språkanalysmodell.

– Vad gällande de semantiska analyserna har forskningen inte kommit lika långt. Därför har vi valt att utveckla en egen modell för semantisk analys, och jag hoppas och tror att vår modell kommer att vara betydelsefull i forskningen om semantisk språkbearbetning, säger Anna Jonsson.

Avhandling:

Best Trees Extraction and Contextual Grammars for Language Processing. (Svensk titel: Extrahering av optimala träd samt kontextuella grafgrammatiker för språkbearbetning)

Kontakt:

Anna Jonsson, Institutionen för datavetenskap, Umeå universitet, aj@cs.umu.se

Senaste nytt

Musiklokal med entusiastisk publik som sträcker upp händer.

28 juni 2024

Svensk hiphop flyttar gränser

28 juni 2024

Svensk hiphop har gått från förortsspelningar till folkliga Allsång på Skansen. Men samtidigt som artisterna blivit allt mer mainstream har de skapat en egen syn på svensk identitet. På så sätt kan de bidra till ett mer inkluderande samhälle som är både ”lagom” och ”orten”,...

MusikMigration och integration

Mammut med tjock päls och kraftiga långa betar.

28 juni 2024

Mammutarnas sista svåra tid kartlagd

28 juni 2024

Färre än tio ullhåriga mammutar gav upphov till den allra sista populationen på Wrangels ö. Trots att stammen återhämtade sig led mammutarna av skadliga mutationer under tusentals år. Men varför de till slut dog ut är fortfarande ett mysterium.

DjurGenetik

Kreml i Moskva- med palatsbyggnad och guldfärgade kupoltorn.

27 juni 2024

Svårare att följa Rysslands krigsförmåga – nya metoder behövs

27 juni 2024

Den fullskaliga invasion av Ukraina har ökat efterfrågan på analyser av Rysslands militära förmåga. Men att studera detta har alltid varit svårt – och nu ännu mer invecklat. Forskare justerar därför sina metoder.

Kriget i UkrainaKrig

Spade med jord från mark med omgivande gräsmark.

27 juni 2024

Igenväxta gräsmarker stör bakterier och svampar

27 juni 2024

Det är inte bara växter och insekter som hotas när gräsmarker och naturbeten växer igen. Även svampar och bakterier påverkas när mer skog tar plats, visar en avhandling.

Biologisk mångfaldBakterierSvamp

När datorer lär sig människospråk måste regler brytas

Datorn behöver bättre språkanalys

Avhandling:

Kontakt:

Relaterade artiklar - Natur & teknik

Robotar kan få lika bra känsel som människor

AI håller koll på risker med tung snö

AI skriver journalen tio gånger snabbare än doktorn

Lättare att snacka med robot som ger ögonkontakt

Senaste nytt

Svensk hiphop flyttar gränser

Mammutarnas sista svåra tid kartlagd

Svårare att följa Rysslands krigsförmåga – nya metoder behövs

Igenväxta gräsmarker stör bakterier och svampar

Nyhetsbrev med aktuell forskning