Vi tillhandahåller en strukturerad kunskapsgraf med svensk juridisk information, fritt tillgänglig via HuggingFace för forskare, utvecklare och organisationer.
Utforska datasetet på HuggingFace Stöd projektetAILink är ett initiativ med målet att göra svensk juridisk information lättillgänglig för maskininlärning, forskning och praktisk tillämpning. Sverige har ett rikt rättsligt arv med lagar, förordningar, domstolsavgöranden och myndighetsbeslut – men dessa resurser är sällan samlade och strukturerade för modern AI-användning.
Vår databas samlar och normaliserar information från källor som:
Datasetet är tillgängligt i Parquet-format,
kompatibelt med HuggingFace datasets-biblioteket.
Varje post innehåller källtext, metadata (lag, paragraf, datum, domstol m.m.) samt en normaliserad textrepresentation lämplig för finjustering av språkmodeller.
Datasetet distribueras under Creative Commons Attribution 4.0 (CC BY 4.0), vilket tillåter fri användning med källhänvisning.
Den aktuella versionen (v1.0) innehåller över 500 000 poster och täcker rättsområden som avtalsrätt, straffrätt, familjerätt och förvaltningsrätt.
📦 Datasetet finns tillgängligt på HuggingFace:
huggingface.co/datasets/ailinkKom igång snabbt med HuggingFace datasets-biblioteket i Python:
from datasets import load_dataset
dataset = load_dataset("ailink")
# Visa ett exempel
print(dataset["train"][0])
Datasetet lämpar sig för uppgifter som frågebesvarande (QA), textsummering, klassificering av rättsliga dokument samt finjustering av svenska språkmodeller med juridisk domänkunskap.
Har du frågor, hittat ett fel i datasetet eller vill bidra till projektet? Kontakta oss gärna via e-post eller öppna ett ärende på vår HuggingFace-sida.