Pierre Lison
Hva forsker du på?
Jeg er informatiker og forsker på kunstig intelligens, mer spesifikt språkteknologi. Målet med språkteknologi er utvikling av algoritmer som klarer å forstå naturlige språk som f.eks. norsk eller engelsk. De meste kjente anvendelsene er talegjenkjenning, maskinoversettelse (som Google Translate), dialogsystemer (som Siri og Alexa) og informasjonsgjenfinning i store mengder tekst. Min egen forskning fokuserer på modellering av dialog. Hvordan fungerer en samtale mellom to eller flere personer? Og hvordan kan vi modellere denne prosessen slik at en maskin forstår hva som foregår? Jeg har blant annet forsket på oversettelse av teksting fra filmer og TV-serier, hvor målet var å lage mer «kontekstbevisste» systemer som dynamisk kan tilpasse oversettelsene til konteksten.
Maskinlæring spiller en sentral rolle i min forskning. Naturlige språk er nemlig så komplekse og flertydige at det er nærmest umulig å skrive regler som kan dekke alle mulige tilfeller. I stedet bruker vi maskinlæring for å automatisk lære opp språkmodeller utfra store mengder språkdata. I de siste årene har neuralske nettverk også vist imponerende resultater i mange oppgaver, og en stor del av mitt forskningsarbeid går ut på å bygge opp nye neuralske nettverk og evaluere hvor godt de fungerer.
Hva er de mest spennende problemstillingene innenfor ditt fagfelt?
En sentral utfordring i språkteknologi er tilgang til språkdata i tilstrekkelig mengde og kvalitet. For å f.eks utvikle et maskinoversettelsesystem mellom norsk og kinesisk, trenger vi millioner av setninger oversatt mellom disse to språkene. Og for et talegjenkjenningsystem trenger vi tusenvis av timer med språkdata som er transkribert ord for ord. Takket være internett er det selvfølgelig blitt mye lettere å få tak i språkdata, men i mange tilfeller har vi rett og slett ikke nok. Mangelen på språkdata er spesielt kritisk for «mindre» språk, da brorparten av språkteknologiske ressurser fokuserer på engelsk og et fåtall andre språk. Når språkdata ikke strekker til, må vi kombinere maskinlæringsmodeller med andre, mindre datasultne metoder (basert på f.eks. ekspertkunnskap). Men hvordan vi best kan gjennomføre en slik kombinasjon er fremdeles et åpent spørsmål.
Et annet viktig tema er utvikling av «smartere» modeller av naturlige språk, som tar høyde for all den hverdagskunnskapen og sosiale konvensjoner som vi mennesker bruker når vi kommuniserer med hverandre. Hvis noen hilser på meg på gata bør jeg f.eks. hilse tilbake. Det er opplagt for oss, men ikke for en datamaskin. Integrering av slik implisitt kunnskap i språkteknologiske modeller er derfor et annet viktig spørsmål for forskningsfronten.
Hvorfor og hvordan ble du interessert i ditt forskningfelt?
Jeg har alltid hatt en interesse for matte og teknologi på det ene siden, og humaniora på den annen siden. Jeg valgte å utdanne meg som sivilingeniør i informatikk (ved Universitet i Louvain, Belgia), men min gamle interesse for språk forsvant ikke av den grunn, og jeg tok en del kurs i lingvistikk ved siden av hovedfaget mitt. På veien oppdaget jeg at det fantes et fagfelt med navn «språkteknologi» eller «datalingvistikk» og som befinner seg i skjæringspunktet mellom informatikk, språkvitenskap og statistikk. Det var den perfekte måten å kombinere de to vitenskapelige interessene mine. Etter å ha fullført mine sivilingeniørstudier, bestemte jeg meg for å videreutdanne meg innen språkteknologi og reiste til Saarbrücken i Tyskland, som har et av de største forskningmiljøene i Europa på dette fagfeltet.
I Saarbrücken jobbet jeg også deltid som forskningsassistent ved det Tyske Forskningssenter for Kunstig Intelligens (DFKI). Jeg jobbet med utvikling av nye algoritmer for snakkende roboter, som en del av et stort europeisk FoU-prosjekt. Dette arbeidet var absolutt spennende og overbeviste meg til å bli forsker. Jeg tok en doktorgrad ved Universitetet i Oslo, og etter en postdokstilling ved samme sted ble jeg ansatt som seniorforsker ved Norsk Regnesentral, hvor jeg jobber nå.
Hvordan ser din forskerhverdag ut?
Inntil for 20 år siden var forskning på kunstig intelligens ganske abstrakt og lite evidensbasert. Den økende populariteten til maskinlæringmetoder har brakt et mye sterkere fokus på eksperimenter og empiriske resultater. Med «eksperimenter» mener jeg at vi ta for oss en bestemte oppgave (f.eks. å oversette tekster fra norsk til kinesisk), definere en evalueringsmetode (f.eks. hvor lik oversettelsene produsert av systemet er sammenlignet med dem fra menneskelige oversettere), og teste ut ulike maskinlæringsmodeller på oppgaven for å finne ut hva som fungerer best. Disse eksperimentene er ofte ganske krevende når det gjelder regnekraft, og vi jobber derfor ofte på regneklynger eller store regneservere.
Maskinlæringsmodellene blir stadig mer komplisert og utvikler seg i rasende tempo, spesielt innen «deep learning», som er store neuralske nettverker med mange prosesseringslag. Det er derfor nærmest umulig for en enkelt forsker å følge opp på alt som skjer på forskningsfronten, og teamarbeid er derfor helt nødvendig for å lykkes. Noen forskere tar seg av den matematiske modelleringen, mens andre er sterkere på implementering eller eksperimentell design.
Hvilke saker vil du jobbe for gjennom Akademiet for yngre forskere?
Yngre forskere har ofte et annet perspektiv enn mer etablerte forskere i spørsmål om hvordan forskings-Norge bør organiseres. En særdeles viktig utfordring er den omfattende bruken av midlertidighet i akademia og mangelen på karrierveiledning i de fleste institusjonene. Som utenlandsk forsker er jeg også opptatt av internasjonalisering av norske forskningsmiljøer. Et tredje tema som jeg er spesielt interessert i er tilgangen til forskningsdata, særlig data som inneholder person- og/eller helseopplysninger. Dagens administrative prosesser for å få de nødvendige tillatelsene er ofte lange, uoversiktlige og krevende med tanke på papirarbeid. Dette er et problem for mange forskere, men kanskje spesielt for de yngre, siden de ofte jobber på midlertidige kontrakter med sterk tidspress.
Jeg er også opptatt av vitenskapsformidling. Et demokratisk samfunn trenger tilgang til kvalitetssikret kunnskap, og forskere har en særdeles viktig rolle å spille, både for å presentere nye forskningsfunn og bidra i offentlige debatter. I tillegg til formidling av faglig kunnskap, synes jeg også at det er viktig å formidle hvem vi er, det vil si hva vi driver med som forskere og hva motiverer oss i vårt arbeid. Yngre forskere kan nemlig være viktige rollemodeller for ungdom.