Webb, GEO & tillgänglighet

llms.txt: vad det är och varför er sajt behöver det

Vad är llms.txt och varför ska sajten ha det?

llms.txt är en markdown-fil i domänroten som ger språkmodeller en kurerad karta över sajtens viktigaste innehåll, så att en AI snabbt hittar rätt utan att läsa hela HTML-strukturen. Den föreslogs av Jeremy Howard i september 2024.

Filen ligger på /llms.txt, precis som robots.txt ligger på /robots.txt. Specen är medvetet enkel: en H1 med sajtens namn, en valfri sammanfattning, och länklistor som pekar AI:n mot det innehåll som betyder mest. Tanken var att lösa ett konkret problem, kontextfönstren i språkmodeller är för små för att svälja en hel webbplats, så modellen behöver en genväg till essensen.

Men efter arton månader finns hård data, och bilden är mer nyanserad än hypen. Den här artikeln går igenom vad filen faktiskt gör 2026, var den hör hemma, och varför den ofta blandas ihop med två helt andra saker: robots.txt och de juridiska protokollen för AI-träning.

Varför det spelar roll

Webben får en ny läsare. Vid sidan av människor och sökmotorernas crawlers läser nu språkmodeller och AI-agenter sajter, för att svara på frågor, sammanfatta dokumentation eller utföra uppgifter. Frågan om hur ni gör innehåll läsbart för den läsaren är en del av samma arbete som tillgänglighet och teknisk SEO: ni styr hur maskiner förstår er.

llms.txt marknadsförs ofta som vägen till fler AI-citeringar. Den premissen håller inte. SE Ranking analyserade 300 000 domäner och fann en adoptionsgrad på 10,13 procent, men ingen mätbar effekt på hur AI ser eller citerar innehåll, varken statistisk analys eller maskininlärning gav utslag (SE Ranking, 2026). Trakkr skannade 37 894 AI-citerade domäner och fick samma resultat: citeringsfördelen var statistiskt noll, p=0,81 (Trakkr Research, uppdaterad 2026-03-14). Google säger dessutom rakt ut nej. John Mueller har jämfört filen med den döda keywords-metataggen, och Gary Illyes bekräftade på scen under Search Central Live Deep Dive APAC i Bangkok i juli 2025 att Google inte stödjer filen och inte planerar att göra det (källa: Search Engine Roundtable, 2025-07-24, hämtad 2026-06).

Så varför bry sig? För att filen har hittat ett annat och verkligt jobb än det den säljs på. Det jobbet är värt att förstå innan ni lägger tid på fel motiv.

Hur det fungerar

En llms.txt är ren markdown och följer en stram struktur. Det enda obligatoriska är en H1 med sajtens eller projektets namn. Allt annat är valfritt: en blockquote med en kort sammanfattning, fri markdown-text, och en eller flera H2-sektioner som var och en innehåller en lista med länkar i formen [namn](url) med en kort notering. Inuti länksektionerna är bilder, HTML, tabeller och nästlade rubriker inte tillåtna (llmstxt.org).

Specen definierar två filer med olika syfte:

Fil	Innehåll	Vem laddar den
`/llms.txt`	Kurerad indexvy: namn, sammanfattning, länkar till nyckelinnehåll	Agenten som vill orientera sig snabbt
`/llms-full.txt`	Allt innehåll konkatenerat till en stor markdown-fil	Kodagenten som vill ladda “hela manualen på en gång”

Det verkliga användningsfallet är den agentiska webben. Kodassistenter som Cursor, Claude Code, GitHub Copilot, Cline, Windsurf och Aider hämtar rutinmässigt llms.txt och llms-full.txt för att ladda dokumentation in i sitt kontextfönster. Det är därför Anthropic, Cloudflare och Vercel publicerar filen, den är en maskinläsbar karta som agenter ruttar på, inte en SEO-knapp. Claude Codes egen dokumentation ligger på /docs/llms.txt.

Det är här skillnaden mot robots.txt blir skarp. robots.txt är åtkomstkontroll: den säger åt crawlers vilka URL:er de får och inte får hämta, blockerar staging och admin, och styr crawl-budget. llms.txt är vägledning: den pekar på det viktigaste och beskriver vad sajten är. robots.txt kan stänga en dörr; llms.txt kan inte stänga någonting, den bara visar var rummen finns (Search Engine Land).

När det passar

llms.txt passar bra i några tydliga fall:

Ni publicerar dokumentation eller en kunskapsbas som kodagenter och tekniska användare kommer att läsa via verktyg som Cursor eller Claude Code. Här är llms-full.txt ofta mer värd än llms.txt.
Ni har ett produkt-API eller en utvecklarportal där agenter behöver en snabb, ren ingång till rätt sidor.
Ni vill experimentera tidigt på en yta där konkurrensen på svenska fortfarande är låg, och accepterar att nyttan ligger i agent-läsbarhet, inte i citeringar.

Filen är billig att skapa och underhålla, och den skadar inte. Om er sajt har struktur som agenter rimligen vill navigera, är den en rimlig investering.

När det inte passar

Det här är den viktigare halvan, och den de flesta guider hoppar över.

Ni gör det för att rankas eller citeras högre av AI. Bevisen säger att effekten är noll. Att lägga tid på llms.txt med citerings-motiv är att optimera fel sak. Lägg den tiden på innehåll som direkt besvarar frågor, med siffror och namngivna källor, det är vad svarsmotorerna faktiskt plockar upp.
Ni tror att den skyddar mot AI-träning. Den gör ingenting juridiskt. För rättsreservation behövs andra protokoll, mer om det nedan.
Ni har en liten marknadssajt utan dokumentation. Då finns sällan något för en kodagent att navigera, och nyttan blir teoretisk.
Ni förväntar er att den ska underhålla sig själv. En llms.txt som pekar på borttagna sidor är sämre än ingen alls. Utan en process som håller den i synk med sajten förfaller den.

Konkret exempel

Digitalist publicerar en egen llms.txt på public/llms.txt. Den inleds med en H1, # Digitalist Open Tech, följt av en blockquote som sammanfattar vad bolaget gör, och därefter H2-sektioner som ## Erbjudanden och ## Kunskap, var och en med länkar i formen [namn](url) och en mening om vad sidan innehåller. En kodagent som öppnar filen ser på några rader vilka erbjudanden och kunskapsartiklar som finns och var de bor. Det är hela poängen: en karta, inte en kopia av sajten.

För en svensk webbansvarig som ska navigera AI-förordningens transparensregler är det avgörande att hålla isär två filer som lätt blandas ihop. EU-kommissionen körde en konsultation mellan 1 december 2025 och 23 januari 2026 om vilka maskinläsbara protokoll som ska gälla för rättsreservation mot text- och datautvinning (TDM) under AI-förordningen (EU-kommissionen, 2025-12-01). De åtta lösningar som utvärderades hämtades från EUIPO:s studie och inkluderar robots.txt, TDM Reservation Protocol (TDMRep), C2PA TDM Assertions och ai.txt. llms.txt finns inte bland dem. Den filen styr alltså inte er rätt att reservera er mot AI-träning, den frågan löses på ett annat ställe, med ett annat protokoll.

Det här blir skarpt i augusti 2026, när AI-förordningens transparensregler för generella AI-modeller träder i kraft. Leverantörer måste då publicera en tillräckligt detaljerad sammanfattning av träningsdata enligt AI-kontorets mall, så att rättighetshavare kan kontrollera om verk använts och om opt-out respekterats (artikel 53, EU AI Act). Att veta vilken fil som gör vilket jobb är en del av den beredskapen.

Vanliga missförstånd

“llms.txt är samma sak som robots.txt fast för AI.” Nej. robots.txt är en spärr som styr åtkomst; llms.txt är en karta som vägleder. De löser olika problem och utesluter inte varandra. Ni kan ha båda, och de talar inte om för varandra vad de gör.

“Lägger jag llms.txt blir jag citerad av ChatGPT.” Det stämmer inte enligt 2026 års data. Två stora studier hittade ingen citeringsfördel, och svarsmotorerna crawlar HTML direkt snarare än att hämta filen. Citeringar vinns med innehåll som svarar tydligt, inte med en fil i roten.

“llms.txt skyddar mitt innehåll mot AI-träning.” Den gör det inte. Rättsreservation kräver separata, juridiskt erkända protokoll som TDM Reservation Protocol. llms.txt är en vägvisare, inte ett lås.

Evidensläget i den här artikeln gäller för första halvan av 2026, och ämnet rör sig snabbt. Kontrollera adoption, leverantörsstöd och regelverk på nytt innan ni fattar beslut, och behandla llms.txt som det den är: en karta för agenter, inte en genväg till synlighet.

Vanliga frågor

Vad är skillnaden mellan llms.txt och robots.txt?

De gör motsatta saker. robots.txt säger åt crawlers vilka URL:er de inte får hämta, det är en spärr för åtkomst och crawl-budget. llms.txt säger i stället "så här ser sajten ut och här finns det viktigaste" som en kurerad karta i markdown. robots.txt blockerar, llms.txt vägleder. Ingen av dem styr om innehållet får användas för AI-träning.

Hur skriver man en llms.txt?

Filen är ren markdown och läggs i domänroten på /llms.txt. Det enda obligatoriska elementet är en H1 med sajtens namn. Därefter följer en valfri kort sammanfattning som blockquote, och en eller flera H2-sektioner med länkar i formen [namn](url) plus en kort notering per länk. Bilder, HTML och tabeller är inte tillåtna inuti länksektionerna.

Är llms.txt en officiell standard?

Inte ännu, llms.txt är ett öppet förslag, inte en formell standard. Det lanserades av Jeremy Howard i september 2024 och dokumenteras på llmstxt.org. Ingen större AI-leverantör har formellt åtagit sig att stödja det, och Google har sagt rakt ut att de inte stödjer filen.

Höjer llms.txt chansen att bli citerad av ChatGPT eller Perplexity?

Det finns ingen mätbar effekt enligt 2026 års data. Två oberoende studier på hundratusentals respektive nära 38 000 domäner hittade ingen citeringsfördel av att ha filen. AI-svarsmotorer crawlar HTML direkt och hämtar sällan /llms.txt. Filen är värdefull för kodassistenter, inte som en knapp för AI-citeringar.

Reserverar llms.txt rätten mot AI-träning på mitt innehåll?

Nej, det är en vanlig förväxling. llms.txt styr ingenting juridiskt. För att reservera rätten mot text- och datautvinning under AI-förordningen används separata maskinläsbara protokoll, till exempel TDM Reservation Protocol. EU-kommissionens konsultation 2025–2026 utvärderade åtta sådana lösningar, och llms.txt fanns inte bland dem.

Fabian von Tiedemann Affärsutvecklingschef · Digitalist Uppdaterad 4 juni 2026

Vill ni omsätta det här i praktiken?

Boka ett kort samtal med en kundansvarig.

Kontakta oss