Juridisk kunskap för Sverige – öppen och tillgänglig

Vi tillhandahåller en strukturerad kunskapsgraf med svensk juridisk information, fritt tillgänglig via HuggingFace för forskare, utvecklare och organisationer.

Utforska datasetet på HuggingFace Stöd projektet

Om projektet

AILink är ett initiativ med målet att göra svensk juridisk information lättillgänglig för maskininlärning, forskning och praktisk tillämpning. Sverige har ett rikt rättsligt arv med lagar, förordningar, domstolsavgöranden och myndighetsbeslut – men dessa resurser är sällan samlade och strukturerade för modern AI-användning.

Vår databas samlar och normaliserar information från källor som:

Om datasetet

📂

Format

Datasetet är tillgängligt i Parquet-format, kompatibelt med HuggingFace datasets-biblioteket.

🏷️

Struktur

Varje post innehåller källtext, metadata (lag, paragraf, datum, domstol m.m.) samt en normaliserad textrepresentation lämplig för finjustering av språkmodeller.

🔓

Licens

Datasetet distribueras under Creative Commons Attribution 4.0 (CC BY 4.0), vilket tillåter fri användning med källhänvisning.

📊

Storlek

Den aktuella versionen (v1.0) innehåller över 500 000 poster och täcker rättsområden som avtalsrätt, straffrätt, familjerätt och förvaltningsrätt.

📦 Datasetet finns tillgängligt på HuggingFace:

huggingface.co/datasets/ailink

Hur du använder datasetet

Kom igång snabbt med HuggingFace datasets-biblioteket i Python:

from datasets import load_dataset

dataset = load_dataset("ailink")

# Visa ett exempel
print(dataset["train"][0])

Datasetet lämpar sig för uppgifter som frågebesvarande (QA), textsummering, klassificering av rättsliga dokument samt finjustering av svenska språkmodeller med juridisk domänkunskap.

Kontakt

Har du frågor, hittat ett fel i datasetet eller vill bidra till projektet? Kontakta oss gärna via e-post eller öppna ett ärende på vår HuggingFace-sida.

📧 [email protected]

huggingface.co/datasets/ailink

Stöd projektet på Open Collective