- Att gripa tillfället i flykten

- Jag har gripit tillfället i flykten, sier Stig Johansson når vi ber ham forklare sin suksess som forsker innenfor feltet korpuslingvistikk. Johansson er professor ved Institutt for britiske og amerikanske studier (IBA) og vinner av årets forskningspris ved Universitetet i Oslo.

- Jeg visste ingenting om at jeg var foreslått før brevet om at jeg hadde vunnet kom, forteller forskningsprisvinner Stig Johansson.
Foto: Ståle Skogstad

- Jeg visste ingenting om at jeg var foreslått, før brevet om at jeg hadde vunnet kom. Det er svært hyggelig at vi får en slik anerkjennelse for arbeidet vi har gjort, sier Stig Johansson.

- Hva er korpuslingvistikk?

- I korpuslingvistikken bruker vi tekstsamlinger i elektronisk form i studiet av språk, forklarer Johansson. Han kom til Universitetet i Oslo i 1976. - Min kontrakt som forskarassistent ved Lunds universitet gikk ut, og jeg fikk et tips om at det var en stilling ledig som dosent i Oslo. - "Jag grep tillfället i flykten", sier han. Johansson er fra Småland og snakker fortsatt svensk, om enn i en litt modifisert form etter 25 år i Norge.

På instituttet omtales han som en gründer, en som begynte å arbeide med korpus mens datamaskiner fortsatt var noe relativt ukjent og nytt for de fleste forskere innenfor humaniora.

- Hva fikk deg til å velge korpuslingvistikken som arbeidsfelt?

- Jeg kjente til en del ting som foregikk på dette området da jeg kom til UiO i 1976. Det første virkelige korpuset var blitt bygd opp i USA på 60-tallet ved Brown University i Providence, forteller Johansson. Her hadde man samlet utdrag av 500 tekster skrevet i 1961, hvert utdrag på 2000 ord.

- Jeg visste også at professor Geoffrey Leech arbeidet med å bygge opp en britisk parallell til Brown-korpuset i Lancaster, og at dette arbeidet av ulike årsaker hadde gått i stå, blant annet på grunn av rettighetsproblematikk og teknologiske problemer, forteller han.

Johansson sendte et brev til Lancaster hvor han tilbød sin hjelp, og i februar 1977 kom Geoffrey Leech til Oslo. Hit kom også Nelson Francis, en av pionerene fra Brown University, som på dette tidspunktet var gjesteforeleser i Trondheim, professor Jan Svartvik fra Lunds universitet, og Jostein Hauge, den gang sjef for NAVFs EDB senter for humanistisk forskning i Bergen, det nåværende Humanistisk datasenter.

- Støtten vi fikk fra Jostein Hauge ble helt avgjørende, understreker Johansson. - For å gjøre dette arbeidet trengtes både teknologiske og lingvistiske ressurser og kunnskaper, og Hauge forstod at dette var noe det var verdt å satse på. Jeg hadde aldri klart dette alene.

På møtet i Oslo ble nettverket ICAME (International Computer Archive of Modern English) opprettet. Det ble også starten på arbeidet med Lancaster-Oslo/Bergen korpuset (LOB).

- Jeg satte meg ned og skrev hundrevis av brev til innehavere av copyrights, og i løpet av 1977 fikk vi de tillatelsene vi trengte, forteller Johansson. Neste skritt var å fullføre det arbeid som var påbegynt i forbindelse med innsamlingen av tekster. - Vi skilte mellom femten typer tekst innenfor kategoriene skjønnlitteratur, avistekst og sakprosa. Målet var at tekstkategoriene i korpuset skulle være mest mulig parallelle med kategoriene i det amerikanske korpuset, sier Johansson, og tilføyer at det ikke alltid var like lett. - Kategorien "western and adventure" i Brown-korpuset fikk mer "adventure" og mindre "western" i det britiske korpuset, bemerker han. På denne tiden innledet Johansson også sitt samarbeid og vennskap med Knut Hofland, den gang ingeniør ved NAVFs EDB-senter for humanistisk forskning i Bergen.

Johansson forteller med glød og entusiasme om sine mange prosjekter, og beskriver en rivende teknologisk utvikling i løpet av sine år som forsker. - I LOB-korpuset måtte tekstene skrives inn manuelt, og i dag finnes det uendelige mengder elektronisk materiale. Det var tungvint å søke i de store datamaskinene på 70-tallet, og alle ordene i LOB-korpuset ble derfor lagret i alfabetisk rekkefølge på magnetbånd og mikrofiche-konkordans. I dag er dette passé, og vi sprer tekst via Internett og CD-rom, sier Johansson. Utviklingen med hensyn til kvantitet har vært større enn han forestilte seg på 70-tallet.

- Brown-korpuset inneholder en million ord, hvilket på denne tiden var enormt. British National Corpus fra 90-tallet inneholder 100 millioner ord, sier han.

I de senere årene har han viet mye av sin tid til den kontrastive lingvistikken og har blant annet ledet oppbyggingen av English-Norwegian Parallel Corpus (ENPC) som inneholder engelske originaltekster og deres norske oversettelser. Det inneholder også norske originaltekster med engelsk oversettelse, forteller Johansson .

- Korpuset kan brukes i pedagogisk sammenheng, men vår hovedmotivasjon er å lære mer om språk, både norsk og engelsk, sier han og gir oss noen eksempler. - Se på ordet "sikkert". Betyr dette ordet egentlig at noe er sikkert? Et søk i parallellkorpuset viser at "sikkert" i engelsk oversettelse i mange tilfeller gjegis med ordet "probably". På denne måten kan oversettelsen brukes som et semantisk speil. Ting vi vanligvis tar for gitt kan vi få ny innsikt i gjennom en overskridelse av språkgrensene.

Johansson forteller at prosjektet er blitt utvidet til også å gjelde andre språk. - Oslo Multilingual Corpus (OMC) er en videreutvikling av ENPC. - Her samarbeider vi med forskere ved flere institutter om et korpus som består av originaltekster på engelsk, tysk og fransk og oversettelsene til de andre språkene. Ved å bygge ut til flere språk kan vi få svar på flere spørsmål og finne svar som kan gi mer generell kunnskap, sier han.

- Du har ifølge dine kolleger en enorm arbeidskapasitet?

- Det følger mye hardt arbeid med korpuslingvistikk, ikke bare tankearbeid, men mye konkret praktisk arbeid, som innhenting av rettigheter, korrekturlesning og annen gjennomgang av materialet, sier Johansson. Han innrømmer imidlertid at han er opptatt av å gjøre ting ferdig.
- Jeg misliker sterkt at ting blir liggende, sier han.

Emneord: Priser, Forskning Av Grethe Tidemann
Publisert 5. sep. 2001 09:55 - Sist endret 10. des. 2008 14:44
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere