Hopp til innhold
Alle artikler

Regulering

EUs AI-forordning for dokumentbehandlingsverktøy: hva som faktisk gjelder

AI-forordningens risikopyramide er kjent; hvordan den lander på en dokumentklassifiserer eller et sladdeverktøy er mindre kjent. En praktisk lesning av forbudte praksiser, høyrisiko-Annex III-kategorier, åpenhetsplikter, og tidslinjen som betyr noe.

8 min lesningAv SafeMediAI Redaksjon

EUs AI-forordning, forordning (EU) 2024/1689[1], er kjent for å være bygd som en risikopyramide. Mesteparten av den offentlige diskusjonen har handlet om toppen (forbudte praksiser og høyrisiko-systemer) og bunnen (generelle AI-modeller, GPAI). Midten, der dokumentbehandlingsverktøy som regel ligger, har fått mindre oppmerksomhet. Det er også her det meste av håndhevingen vil havne, fordi det er her de fleste faktiske utrullingene befinner seg.

Denne artikkelen er for virksomheter som tar i bruk eller bygger dokumentbehandlings-AI (sladding, klassifisering, pipelines med OCR og NLP, generativ dokumentsammendrag, kontraktsanalyse) inn i europeisk arbeid. Vi går gjennom de delene av AI-forordningen som faktisk gjelder, delene som ikke gjelder selv om markedsføringen skulle antyde noe annet, og tidslinjen som avgjør når hver plikt slår inn.

Risikopyramiden i ett avsnitt

Forordningen etablerer fire risikonivåer. Forbudte praksiser (artikkel 5) er forbudt helt.[2] Høyrisiko-systemer (artikkel 6 og Annex III) har strenge plikter knyttet til samsvarsvurdering, dokumentasjon, risikohåndtering, datastyring, logging og menneskelig tilsyn.[3] Systemer med begrenset risiko har åpenhetsplikter etter artikkel 50 (reglene om merking av AI-generert innhold).[5] Systemer med minimal risiko har ingen forordningsspesifikke plikter ut over frivillige praksiskoder. Generelle AI-modeller (GPAI), grunnmodellene i GPT-klassen, har sitt eget sett av plikter etter artiklene 51-55, uavhengig av hvor den endelige utrullingen ligger.

For dokumentbehandlings-AI er spørsmålet hvilket nivå du havner på. Svaret er mer nyansert enn markedsføringen vil ha det til.

Hva som er forbudt

Forbudene i artikkel 5 trådte i kraft 2. februar 2025.[6] Listen er kort, men konkret: underbevisst manipulasjon, utnytting av sårbarheter hos bestemte grupper, sosial scoring i regi av offentlige myndigheter, sanntids fjernidentifisering med biometri i offentlige rom utført av politi (med snevre unntak), prediktivt politiarbeid utelukkende basert på profilering, ikke-målrettet skraping av ansiktsbilder for biometriske databaser, følelsesgjenkjenning på arbeidsplasser og skoler (med snevre unntak), og biometrisk kategorisering for å utlede sensitive attributter.

Dokumentbehandlingsverktøy treffes nesten aldri av artikkel 5. To nærliggende tilfeller er likevel verdt å flagge:

  • Et AI-verktøy som utleder seksuell legning, religion, politiske syn eller fagforeningsmedlemskap fra dokumenter, vil falle inn under forbudet mot biometrisk kategorisering dersom utledningen bruker biometriske data, og er uansett i faresonen. Dokumentklassifiserere som merker etter politisk tilhørighet, for eksempel, trenger svært nøye formålsbegrensning.
  • En følelsesgjenkjennings-funksjon brukt på dokumenter i en arbeidssammenheng (sortering av CV-er etter tone, scoring av hvor entusiastisk en kandidat virker) støter mot forbudet mot følelsesgjenkjenning på arbeidsplassen.

For sladding, dokumentklassifisering etter sensitivitet, OCR og standard kontraktsanalyse, gjelder ikke artikkel 5.

Høyrisiko-klassifisering: når Annex III slår inn

Det er her det meste av arbeidet med dokumentbehandlings-AI ligger. Et system er høyrisiko etter artikkel 6(2) hvis det faller inn under Annex III sin liste over brukstilfeller. Annex III lister åtte høyrisiko-kategorier:[4]

  1. Biometri (fjernidentifisering med biometri, kategorisering etter sensitive attributter, følelsesgjenkjenning).
  2. Kritisk infrastruktur (sikkerhetskomponenter for transport, vann, gass, oppvarming, elektrisitet, digital infrastruktur).
  3. Utdanning og yrkesopplæring (opptak, evaluering, atferdsovervåking).
  4. Sysselsetting, ledelse av arbeidskraft, selvstendig næringsdrivende (rekruttering, ytelsesevaluering, arbeidsfordeling).
  5. Tilgang til essensielle private og offentlige tjenester (kredittverdighet, offentlige ytelser, nødanrop).
  6. Politi (risikovurdering av fysiske personer, polygraf-lignende verktøy, bevisvurdering, profilering).
  7. Migrasjon, asyl, grensekontroll (risikovurdering, identitetsverifisering, søknadsbehandling).
  8. Rettsadministrasjon og demokratiske prosesser (støtte til domstolsbeslutninger, systemer som påvirker valg).

Et dokumentbehandlingsverktøy kan havne i flere av disse, avhengig av bruk. Konkrete eksempler:

  • Et verktøy som screener CV-er og rangerer kandidater, er høyrisiko etter kategori 4.
  • En dokumentklassifiserer som støtter en offentlig forvaltning i å avgjøre tilgang til en ytelse, er høyrisiko etter kategori 5.
  • Et bevisanalysesystem brukt av politietterforskere, er høyrisiko etter kategori 6.
  • Et triageverktøy for migrasjonssøknader brukt av en asylmyndighet, er høyrisiko etter kategori 7.
  • En juridisk research-assistent som støtter domstolsbeslutninger, er høyrisiko etter kategori 8.

Omvendt:

  • Et generelt sladdeverktøy brukt til å sladde interne dokumenter før publisering, er ikke høyrisiko bare av den grunn.
  • En dokumentklassifiserer for intern arkivhåndtering uten påvirkning på beslutninger om enkeltpersoner, er ikke høyrisiko.
  • Et generativt sammendragsverktøy brukt til privat kommersiell dokumentgjennomgang, er ikke høyrisiko.

Det avgjørende spørsmålet i grensesaker er om AI-systemet tar eller i vesentlig grad støtter en beslutning om en fysisk person i én av Annex III-sammenhengene.

Artikkel 6(3)-unntaket

Artikkel 6(3) gir et viktig unntak: hvis et AI-system i en Annex III-kategori ikke utgjør en betydelig risiko for helse, sikkerhet eller grunnleggende rettigheter, er det ikke høyrisiko, selv om det treffer en kategori. Leverandøren må dokumentere denne vurderingen før systemet plasseres på markedet.

Konkrete eksempler fra forordningen:

  • AI-systemet utfører en snever prosedyremessig oppgave.
  • Systemet forbedrer resultatet av en menneskelig aktivitet som allerede er fullført.
  • Systemet oppdager beslutningsmønstre eller avvik, og er ikke ment å erstatte menneskelig vurdering uten ordentlig gjennomgang.
  • Systemet utfører en forberedende oppgave til en vurdering som er relevant for Annex III-brukstilfellet.

For dokumentbehandlingsverktøy er det her mange utrullinger faktisk havner. Et sladdeverktøy som brukes som et forberedende steg før en menneskelig saksbehandler tar den endelige beslutningen om hva som skal utleveres, kan i en Annex III-sammenheng falle inn under 6(3)-unntaket. Leverandøren må skrive ned vurderingen og oppbevare den.

Unntaket er ikke et fribrev. Dokumentasjonen må være reell og må kunne overleve et tilsyn. «Verktøyet vårt er bare et forberedende steg», uten en faktisk analyse, er ikke en holdbar posisjon.

Begrenset risiko: artikkel 50 om åpenhet

Artikkel 50 legger åpenhetsplikter på en egen klasse systemer:[5]

  • Systemer som samhandler direkte med fysiske personer (chatboter, samtale-AI), må opplyse om at de er AI.
  • Systemer som genererer eller manipulerer bilde-, lyd- eller videoinnhold (deepfakes), må merke utdataen som AI-generert.
  • Systemer som genererer syntetisk tekst som publiseres i saker av offentlig interesse, må merke teksten som AI-generert, med mindre innholdet er underlagt redaksjonelt menneskelig tilsyn.

For dokumentbehandlings-AI slår dette tydeligst inn på generative sammendrags- og utkast-verktøy. Genererer systemet substansiell tekst som skal publiseres eller tilskrives et menneske, må det merkes at den er AI-generert. Unntaket for redaksjonelt menneskelig tilsyn betyr mye for redaksjoner og advokatfirmaer.

Plikter for generelle AI-modeller (GPAI)

Hvis du bygger på toppen av en grunnmodell (GPT, Claude, Gemini, Llama), gjelder artiklene 51-55 separat for leverandøren av modellen. De fleste dokumentbehandlings-AI bygd oppå grunnmodeller, er ikke selv GPAI-leverandører; det er den oppstrøms modell-leverandøren.

Når det er sagt, er to indirekte konsekvenser viktige:

  • Nedstrøms leverandører kan støtte seg på den oppstrøms modellens dokumentasjon for deler av sin egen samsvarsvurdering, men bare hvis den oppstrøms leverandøren faktisk har produsert den påkrevde dokumentasjonen. Å bygge på åpne modeller med lite dokumentasjon, betyr mer etterlevelsesarbeid for den nedstrøms utrulleren.
  • Modeller med systemisk risiko (de aller største grunnmodellene, foreløpig definert ved terskler for treningsregnekraft) har ekstra plikter som den oppstrøms leverandøren må oppfylle. Nedstrøms utrullere bør holde oversikt over hvilke modeller som ligger over denne terskelen, fordi anskaffelsesbeslutninger får litt høyere innsats.

Tidslinjen

Datoene som betyr noe for utrullere av dokumentbehandlings-AI:[6]

  • 2. februar 2025: Forbudene i artikkel 5 er i kraft, sammen med plikten til AI-leseferdighet etter artikkel 4 (virksomheter som bruker AI, må sørge for at de ansatte har tilstrekkelig AI-leseferdighet).
  • 2. august 2025: GPAI-pliktene gjelder for modeller som plasseres på markedet fra denne datoen. Medlemsstater utpeker kompetente myndigheter. Sanksjonsrammeverket aktiveres.
  • 2. februar 2026: Kommisjonen publiserer retningslinjer for høyrisiko-klassifiseringen i artikkel 6.
  • 2. august 2026: Den store datoen. Pliktene for høyrisiko-systemer (Annex III) gjelder for systemer som plasseres på markedet eller settes i drift fra denne datoen. Samsvarsvurdering, risikohåndtering, datastyring, logging, menneskelig tilsyn og etter-markeds-overvåking blir alle håndhevbare.
  • 2. august 2027: GPAI-modeller som ble plassert på markedet før august 2025, må være fullt ut samsvarende.

For et dokumentbehandlingsverktøy som kan være høyrisiko, er den praktiske planleggingen nå. Samsvarsvurdering er ikke en papirøvelse; krav til datastyring og risikohåndtering må bygges inn i systemet, ikke skrus på i ettertid. Leverandører som venter til juli 2026 med å begynne, kommer ikke til å være klare.

En praktisk sjekkliste for leverandører og kjøpere

Seks spørsmål viser et dokumentbehandlingsverktøys posisjon under AI-forordningen.

  1. Er dere høyrisiko etter Annex III for noen av deres typiske brukstilfeller? Gjennomarbeidet, skriftlig vurdering per brukstilfelle.
  2. Hvis ja, hvor langt er dere i samsvarsvurderingsprosessen? Meldt organ, harmoniserte standarder, teknisk dokumentasjon.
  3. Hvis 6(3)-unntaket gjelder, er vurderingen dokumentert? Leverandører som selger inn i Annex III-sammenhenger uten denne vurderingen, selger en utrullingsrisiko.
  4. Hvilken artikkel 50-merking har systemet deres? Særlig for generative utdata.
  5. Hvilken GPAI-modell bygger dere på, og hvordan ligger den oppstrøms leverandøren an med etterlevelse?
  6. Hva slags dokumentasjon gir dere utrullere for å støtte deres egen etterlevelse? Samsvar, datastyring, etter-markeds-overvåking, hendelsesrapportering.

For kjøpere bør svarene være konkrete og skriftlige. For leverandører er det å ha svarene klare, en konkurransefordel som vokser i takt med at 2026 nærmer seg.

En avsluttende merknad

AI-forordningen er den første reguleringen av sitt slag som faktisk er vedtatt og trådt i kraft, noensteds. Den er bredere og strengere enn det meste av prognosene fra tidlig i 2024 sa. Instinktet hos mange leverandører har vært å behandle den som et fremtidig problem, et artikkel 5-problem (forbudte praksiser), eller et GPAI-problem (grunnmodeller). For dokumentbehandlings-AI er ingen av delene riktig.

Forordningens faktiske form, for denne kategorien verktøy, er artikkel 6, Annex III, 6(3)-unntaket og fristen 2. august 2026. Det er der arbeidet ligger, og det er arbeidet de bedre leverandørene allerede er i gang med.

Kilder

  1. Forordning (EU) 2024/1689 fra Europaparlamentet og Rådet om harmoniserte regler om kunstig intelligens (AI-forordningen)
  2. AI-forordningen, artikkel 5: Forbudte AI-praksiser
  3. AI-forordningen, artikkel 6: Klassifiseringsregler for høyrisiko-AI-systemer
  4. AI-forordningen, Annex III: Liste over høyrisiko-AI-systemer omtalt i artikkel 6(2)
  5. AI-forordningen, artikkel 50: Åpenhetsplikter for visse AI-systemer
  6. Europakommisjonen, AI Act Implementation Timeline