SweLL – forskningsinfrastruktur för svenska som andraspråk

Korpuslingvistik har under de senaste decennierna fått en allt viktigare roll inom språkvetenskapen, vilket inte minst gäller för andraspråksforskningen. Medan det idag finns större annoterade inlärarkorpusar för en rad olika språk, t.ex. engelska, tyska och norska (jfr Granger et al. 2002), saknas det än så länge en liknande resurs för studier av svenskt inlärarspråk. Infrastrukturprojektet SweLL (Swedish Learner Language) ”syftar till att skapa en plattform för att samla in, digitalisera, normalisera, lingvistiskt annotera och elektroniskt tillgängliggöra texter skrivna av inlärare av svenska. En sådan textsamling skulle möjliggöra sökningar efter språkliga strukturer som utmärker inlärarspråk, med en normaliserad version till ett urval av texter” (Språkbanken 2017). För närvarande undersöker forskargruppen vilka feltaxonomier och metoder som är mest lämpliga för att annotera ett större svenskt inlärarmaterial. Andra inlärarkorpusprojekt som exempelvis The Cambridge Learner Corpus (Nicolls 2003), Falko (Reznicek et al. 2012) och ASK (Tenfjord et al. 2004) annoterar materialet med avseende på olika typer av avvikelser från målspråket, vilket naturligtvis spelar en viktig roll när det gäller studier av inlärarspråk och också kommer vara en viktig del i arbetet med SweLL-korpusen. Vi vill inom projektet undersöka möjligheterna att göra korpusen jämförbar med andra inlärarkorpusar, speciellt med avseende på feltyper. Dessutom, utvärderar vi en potentiell möjlighet att annotera, och därmed göra sökbara, sådana språkliga strukturer som markerar steg i en inlärares grammatiska utveckling. I detta arbete kommer vi att utgå ifrån bedömningsmodellen som utvecklats av Flyman Mattson & Håkansson (2010) som bygger på Processbarhetsteorin och de grammatiska utvecklingsstegen som har identifierats för svenska (Pienemann & Håkansson 1999). Målet är att försöka utveckla möjligheter att annotera strukturer i inlärarnas texter som visar att de har nått ett visst stadium i sin grammatiska utveckling. I föredraget kommer vi att diskutera dessa möjligheter både från ett andraspråksteoretiskt och språkteknologiskt perspektiv.

Referenser

Granger, S.et al. (2002), The International Corpus of Learner English: Handbook and CD-ROM, Louvain-la-Neuve: Presses Universitaires de Louvain.

Flyman Mattsson, A. & G. Håkansson 2010. Bedömning av svenska som andraspråk. En analysmodell baserad på grammatiska utvecklingsstadier. Lund: Studentlitteratur.

Nicholls, D. 2003. The Cambridge Learner Corpus: Error coding and analysis for lexicography and ELT. Proceedings of the Corpus Linguistics 2003 conference 16, 572–58.

Pienemann, M. & Håkansson, G. (1999). A unified approach towards the development of Swedish as L2: a processability account. Studies in Second Language Acquisition 21: 383–420.

Reznicek, M. et al. 2012. Das Falko-Handbuch: Korpusaufbau und Annotationen, Version 2.01. Humboldt-Universität zu Berlin: Institut für deutsche Sprache und Linguistik – Korpuslinguistik.

Språkbanken 2017. < https://spraakbanken.gu.se/swe/swell_infra>. Hämtat 2 april 2017.

Tenfjord, K. et al. 2004. The ASK- corpus – a language learner corpus of Norwegian as a second language. In Proceedings from 5th International Conference of Language Resources and Evaluation (LREC).