DanskGPT: En AI bygget til dansk sprog
En stor sprogmodel udviklet specifikt til at forstå det danske sprogs finurligheder og kulturelle referencer, med fokus på privatliv og datasikkerhed.

Teknologien bag DanskGPT
DanskGPT bygger på avanceret transformer-teknologi, finjusteret specifikt til dansk sprog og kontekst.
Modelarkitektur og træning
DanskGPT er en generativ transformer-model, ligesom kendte modeller fra OpenAI og Meta. Den er resultatet af flere iterationers finjustering af grundmodeller (som LLaMA) specifikt på et stort dansk datasæt. Dette intensive træningsforløb har resulteret i en model, der kan generere sammenhængende dansk tekst og besvare spørgsmål med høj sproglig korrekthed.
Der findes både en basis-udgave optimeret til tekstgenerering og en chat-udgave finjusteret til samtaleformat. Hovedmodellen består af flere milliarder parametre.
Dansk datagrundlag
Modellen er trænet udelukkende på dansk tekst indsamlet fra en bred vifte af kilder som nyhedsartikler, bøger, offentlige dokumenter og online tekster for at sikre en dyb forståelse af dansk sprogbrug og samfundsforhold. Datasættet omfatter ca. 3 milliarder danske ord.
Træningen har også involveret syntetiske data og iterative teknikker (self-instruct), hvor modellen selv genererede nye spørgsmål og svar for gradvist at forbedre evnen til at følge instruktioner og besvare komplekse spørgsmål på dansk.
En mindre open source model, DanskGPT-tiny, er også frigivet under Apache 2.0 licens og kan findes på Hugging Face.
Etik og GDPR i fokus
Udviklet med omhu for privatliv, datasikkerhed og overholdelse af GDPR.
Datasuverænitet
Al behandling kan foregå lokalt på egne servere inden for EU. Ingen brugerdata gemmes eller sendes til eksterne cloud-tjenester, hvilket sikrer fuld kontrol og overholdelse af GDPR-krav om datalokation.
Datasikkerhed
Høj grad af transparens omkring træningsdata (udelukkende danske kilder) minimerer risikoen for indlejring af private data og bias. Dette står i kontrast til lukkede modeller, hvor datagrundlaget er ukendt.
Ansvarlighed
Udviklerne er åbne omkring modellens begrænsninger, herunder risikoen for "hallucinationer". Brugere opfordres til kritisk stillingtagen og informeres om, at modellen ikke altid producerer sandfærdig information.
Ved at bruge DanskGPT undgår virksomheder og offentlige institutioner risikoen for utilsigtet at dele følsomme oplysninger eller forretningshemmeligheder med eksterne parter, hvilket styrker digital suverænitet.
DanskGPT sammenlignet med andre modeller
Hvordan står DanskGPT i forhold til globale sprogmodeller, når det gælder dansk sprog og kontekst?
Dansk nuance og kulturforståelse
Her har DanskGPT en klar fordel. Træningen udelukkende på dansk materiale giver en dyb forståelse for vendinger, idiomer og kulturelle referencer, som globale modeller som ChatGPT, Gemini eller Claude kan overse. Svarene føles ofte mere naturlige og tilpassede til en dansk kontekst.
Domænespecifik dansk viden
For emner specifikt relateret til Danmark (lovgivning, samfundsforhold, historie) har DanskGPT ofte en fordel pga. sit træningsdatasæt. Globale modeller har bred viden, men kan mangle dybde på nicheområder specifikt for Danmark, medmindre de også er dækket bredt internationalt.
Integration og datasikkerhed
Dette er DanskGPT's kernekompetence. Muligheden for lokal installation (on-premise) uden dataudveksling med eksterne servere er afgørende for organisationer med strenge GDPR-krav. Globale modeller som ChatGPT, Gemini og Claude er typisk cloud-baserede, hvilket indebærer dataoverførsel og mindre kontrol.
Open Source vs. Lukket
Ligesom modeller baseret på Mistral, giver DanskGPT (især tiny-versionen) mulighed for fuld gennemsigtighed og tilpasning via sin open source-licens. Dette står i kontrast til de lukkede modeller fra OpenAI, Google og Anthropic. Dog kan de største lukkede modeller ofte håndtere mere komplekse, generelle opgaver på tværs af sprog.
Valget afhænger af behovet: For opgaver, der kræver dyb dansk sprogforståelse, kulturel relevans og høj datasikkerhed, har DanskGPT klare fordele. For bred, generel problemløsning på tværs af sprog kan de største globale modeller være stærkere.
Praktiske anvendelser af DanskGPT
Modellens unikke styrker åbner for en række værdifulde anvendelser i en dansk kontekst.
Offentlig sektor
- Forbedret borgerservice via chatbots, der forstår dansk nuance.
- Effektivisering af sagsbehandling ved resuméring af danske dokumenter.
- Sikring af GDPR-compliance ved lokal databehandling.
- Understøttelse af klart sprog i kommunikationen med borgere.
Virksomheder
- Automatisering af dansk kundeservice (mail/chat) uden datadelingsrisiko.
- Udvikling af interne AI-værktøjer (skrivestøtte, rapportering) på dansk.
- Finjustering af modellen på virksomhedsspecifikke data for skræddersyede løsninger.
- Sikker håndtering af følsomme data i brancher som finans og sundhed.
Borgere og uddannelse
- AI-læringshjælp på modersmålet, der styrker dansk sprogfærdighed.
- Digitale assistenter (apps, smart devices), der taler flydende dansk.
- Afmystificering af komplekst sprog (fx fra det offentlige).
- Offline AI-assistance til opgaver som skrivning eller idégenerering.
En dansk AI der forstår Danmark
DanskGPT repræsenterer et vigtigt skridt mod at udnytte AI's potentiale fuldt ud på dansk, samtidig med at vi respekterer privatliv og styrker digital suverænitet. Det er en AI, der ikke bare taler vores sprog – den forstår det.
Lær mere om DanskGPT