Nasjonalbiblioteket har gjort en glimrende jobb gjennom mange år med å digitalisere nesten alt publisert materiale på norsk gjennom historien. Grunnen til at språkmodeller fra Nasjonalbiblioteket presterer så godt, er at de er trent på innhold i den digitale samlingen.
En av modellene vi har skrevet om tidligere er NB Whisper, en tale-til-tekst-modell som er bedre enn OpenAIs grunnmodell til å oversette og transkribere norsk språk.
NRK og Universitetet i Oslo har laget egne tjenester basert på NB Whisper. Politiet har uttalt at teknologien representerer et enormt effektiviseringspotensial når det kommer til transkribering av avhør.
Jeg har selv gode erfaringer med å kombinere bruk av NB Whisper og og ChatGPT; utvalgte artikler: