Språkbanken vokser

No image

Praterobotene, talegjenkjennerne og verktøyene for automatisk oversettelse blir stadig bedre, i takt med at språkbanken fylles med data. Det lover godt for oppfølgingen av den nye språkloven.

Språkloven trådte i kraft 1. januar i år. I lovproposisjonen blir det presisert at automatiserte språkløsninger skal utvikles parallelt på både nynorsk og bokmål, og at talegjenkjennerne skal kunne forstå dialekt.

Mer presis talegjenkjenning

En forutsetning for å få til dette er at språkbanken utvikler og utvider ressursene. Utvikling av for eksempel en talegjenkjenner – et dataprogram som gjør at man kan snakke til en datamaskin som så skriver det man sier – krever enorme mengder forhåndsanalyserte data som kan «lære» datamaskinen de mange måtene mennesker snakker på. 

Bare de siste to årene har store mengder taledata blitt lagt inn i banken, blant annet transkribert tale fra Stortingets sesjoner og nye uttaleleksikon. Banken har også gjort tilgjengelig nynorsktekster fra kommunale og statlige nettsider og oversettelser fra Nynorsk Pressekontor. Dataene kan brukes til talegjenkjenning, maskinoversettelser, tekstanalyse m.m.

Språkteknologi i språkloven Språkbanken

Språkloven gir offentlige organer et tydelig ansvar for å velge løsninger som fungerer både på nynorsk og bokmål, når de kjøper inn digitale verktøy. Det legger føringer for dem som selger digitale verktøy til offentlig sektor. Det understreker også at språkbanken har en viktig rolle i utviklingen av ressurser til automatiske språktjenester.

Disse temaene blir behandlet på seminaret «Lovlig teknisk», som Nasjonalbiblioteket og Språkrådet etter planen skal arrangere i mars.

I Nasjonalbibliotekets språkbank ligger det en omfattende samling normerte ord med bøyingsformer på nynorsk og bokmål. Samlingen eies og forvaltes av Språkrådet og Universitetet i Bergen og danner grunnlaget for de populære nettordbøkene Bokmålsordboka og Nynorskordboka.

Språkbanken er med på å utvikle norsk språkteknologi. Ressursene i språkbanken er fritt tilgjengelige for alle, også kommersielle aktører. Dataene bidrar til bedre stavekontroller, skrivestøtteprogrammer og undervisningstjenester.

 

Del denne siden

Del på Facebook Del på Twitter

Publisert:11.01.2022 | Oppdatert:11.01.2022