Norske korpusser

Her kan du se et udvalg af de korpusser (altså tekstsamlinger) der findes for de nordiske sprog. På denne side finder du de norske korpusser. For de sprog hvor der det er flere korpusser end vi har fundet det nødvendigt at linke til, har vi begrænset udvalget ved især at linke til korpusser der har en brugervenlig grænseflade med mulighed for forskellige former for søgninger. Desuden har vi forsøgt at få repræsenteret forskellige tekstgenrer, fx skønlitteratur, talesprog og journalistik.

Nordisk dialektkorpus

Dialektkorpusset er en elektronisk samling af lyd- og videooptagelser af 2,7 milliarder ord fra mere end 200 nordiske dialekter, særligt danske, norske og svenske. Korpuset er udviklet af det nordiske samarbejdsprojekt Nordisk dialektsyntaks, mens det konkrete arbejde med at lave korpusset er foregået i Tekstlaboratoriet ved Universitetet i Oslo.

Leksikografisk bokmålskorpus

Bokmålstekster fra 1985 til i dag. Korpuset består av omlag 100 millioner ord. Korpuset er tagget med Oslo-Bergen-taggeren og merket med informasjon om tekstprodusentenes kjønn, alder og geografiske tilhørighet, i tillegg til sjanger, emne og andre vanlige kildeopplysninger. Prosjektleder for korpuset er Ruth Vatvedt Fjeld, Avd. for leksikografi ved Institutt for lingvistiske og nordiske studier ved Universitetet i Oslo, og gjort søkbart i korpussøkesystemet Glossa, som er utviklet av Tekstlaboratoriet. Leksikografisk bokmålskorpus er fritt tilgjengelig for forskning.

Norske korpusser

Liste over norske korpusser fra Universitetet i Oslo.