EU:s AI-förordning ställer krav på att leverantörer av generativa AI-modeller dokumenterar hur modellerna är byggda, tränade och distribuerade. I centrum står transparens, ett område som konkretiseras i GPAI Code of Practice och dess vägledning för dokumentation.
Syftet med transparenskraven
Transparenskraven ska säkerställa att:
- Aktörer som använder modellen förstår dess uppbyggnad, begränsningar och dataursprung
- Tillsynsmyndigheter kan göra oberoende granskning
- Slutanvändare kan ges relevant information om modellens funktion
Model Documentation Form: mall för AI-modellers metadata
Dokumentationsmallen innehåller ett antal obligatoriska informationsfält. Syftet är att standardisera hur modeller beskrivs.
Exempel på fält i formuläret:
Fält | Beskrivning |
---|---|
Modellnamn och version | Identifiering av modellen |
Träningsdata | Datakällor, urvalskriterier, eventuella filter eller uteslutningar |
Beräkningsresurser | otalt antal GPU-timmar, infrastrukturtyp, modellstorlek |
Energiförbrukning | Uppskattad energiförbrukning i träning och inferens |
Modellarkitektur | Övergripande teknisk beskrivning (t.ex. transformerbaserad, multimodal) |
Säkerhetsåtgärder | Kontrollmekanismer för att begränsa oönskade resultat eller spridning |
Exempel på metadata för LLM
En utvecklare av en stor språkmodell (LLM) bör enligt koden kunna beskriva följande:
- Datakällor: T.ex. Common Crawl, Wikipedia, licensierade databanker
- Exkluderingar: T.ex. filtrering av personuppgifter eller bias-relaterade domäner
- Beräkningsmiljö: T.ex. 500 000 GPU-timmar på en molnbaserad plattform
- Koldioxidavtryck: T.ex. 85 ton CO₂-ekvivalenter, verifierat av extern part
Denna nivå av insyn är avsedd att ge både teknisk och etisk överblick över modellens tillkomst.
Transparens som process
Transparens är inte en engångsinsats utan en löpande process. Koden rekommenderar att dokumentationen:
- Uppdateras vid varje ny version eller större reträning
- Görs tillgänglig internt och för relevanta externa parter
- Följs upp med kvalitetssäkring och intern granskning
Vem ansvarar för vad?
- Utvecklingsteamet ansvarar för att dokumentera tekniska data och valda metoder.
- Juridisk funktion säkerställer att dokumentationen följer gällande lagar och AI-förordningens ramverk.
- Ledningsnivå bör etablera styrning och godkännandeprocess för publicering av modelldokumentation.
Transparens vid offentlig upphandling
Dokumentation enligt Model Documentation Form kan bli en konkurrensfördel vid offentlig upphandling eller partnerskap med organisationer som omfattas av AI Act. Tydlig och spårbar information möjliggör:
- Snabbare granskning
- Ökad trovärdighet i compliance-processer
- Möjlighet att visa ansvar i hela utvecklingskedjan
Sammanfattning
EU:s GPAI Code of Practice introducerar ett formaliserat sätt att dokumentera AI-modeller. Genom att strukturera transparens kring:
- Modellens tekniska uppbyggnad
- Träningsresurser
- Datakällor och filter
- Energiförbrukning och säkerhetsmekanismer
…kan leverantörer möta både regulatoriska förväntningar och marknadens krav på ansvarstagande.
Nyckelbegrepp för vidare läsning:
- AI Act transparency obligations
- GPAI metadata documentation
- AI model documentation form
- Foundation model compliance
- Responsible AI development EU
- Energy use in AI training
- AI procurement transparency
Relaterade artiklar i klustret
Detta är en del av ett innehållskluster om GPAI och AI-förordningen. Läs vidare:
Frågor om transparenskraven i AI-förordningen:
Frågor och svar om GPAI-dokumentation, metadata och ansvar
Hur ska generativa AI-modeller dokumenteras enligt AI-förordningen? Här besvaras de vanligaste frågorna om transparenskraven i GPAI Code of Practice.
Vad innebär transparenskraven i AI Act för GPAI-modeller?
GPAI-leverantörer måste dokumentera hur modellen är byggd, tränad och distribuerad. Inklusive datakällor, energiförbrukning och teknisk arkitektur.
Vad är Model Documentation Form?
Det är en standardiserad mall som EU-kommissionen tagit fram som en del av GPAI Code of Practice. Den används för att beskriva metadata och andra tekniska detaljer om AI-modellen.
Måste alla AI-modeller dokumenteras enligt denna mall?
Nej, kraven gäller främst generativa AI-modeller av generell karaktär (GPAI). För andra modeller gäller olika regler beroende på risknivå enligt AI-förordningen.
Vad räknas som metadata i det här sammanhanget?
Metadata inkluderar information om:
- Datakällor och urval
- Träningstid och beräkningsresurser
- Energianvändning
- Modellens versionshistorik och arkitektur
Vem ansvarar för att dokumentationen blir korrekt?
Det är leverantörens ansvar, men flera roller bör vara involverade:
- Teknikteam dokumenterar arkitektur och träning
- Juridisk funktion granskar licensgrunder
- Ledning ansvarar för styrning, godkännande och spårbarhet
Varför är transparens viktigt för GPAI?
För att användare, tillsynsmyndigheter och upphandlare ska kunna förstå hur modellen fungerar och fatta informerade beslut om användning och risk.
Är dokumentationen bindande enligt lag?
Inte ännu. GPAI Code of Practice är i nuläget frivillig, men kan bli en vägledande standard vid tillsyn och upphandling i framtiden.