Om Ordsynonymer.se
Ordsynonymer.se är en fri synonymordbok för svenska som kombinerar data från 12 akademiska och lexikografiska källor. Varje synonympar kan spåras tillbaka till sin ursprungskälla, och varje koppling kvalitetsklassas automatiskt.
Målet är att skapa den mest tillförlitliga fritt tillgängliga resursen för svenska synonymer — användbar både för skribenter som vill variera sitt språk och för forskare som behöver pålitlig lexikal data.
Våra datakällor
Vi bygger inte ordboken från en enda källa. Istället sammanför vi data från 12 oberoende lexikografiska och akademiska resurser och låter dem bekräfta varandra. När två eller fler källor är överens om att ett ordpar är synonymer väger det tyngre än en enskild källa.
Primära källor
SALDO 2.3 — Språkbanken Text, Göteborgs universitet
Semantiskt och morfologiskt lexikon med 131 000 ingångar. Vår största enskilda källa.
CC-BY 4.0SynLex — Viggo Kann, KTH
Synonymlexikon med manuellt verifierade synonympar. Används som gold standard.
Fri användning med attributionFolkets lexikon — KTH Nada
Tvåspråkigt svensk-engelskt lexikon med 17 000 ingångar, idiom och exempelmeningar.
CC-BY-SA 2.5Sekundära källor
Kaikki / Wiktionary — Tatu Ylonen
Maskinläsbar export av svenska Wiktionary med 310 000 ingångar, etymologi, uttal och relationer.
CC-BY-SA 3.0BlingBring — Språkbanken Text
Semantiska fälttilldelningar baserade på Roget-klassificering.
CC-BY 4.0SweFN 2.0 — Språkbanken Text
Svenskt FrameNet med 1 195 ramar och 39 000 lexikala enheter.
CC-BY 4.0Kelly-listan — Göteborgs universitet
Frekvensviktad ordlista med CEFR-nivåer (A1–C2).
CC-BY 4.0Hellquist — Elof Hellquist (1922)
Svensk etymologisk ordbok med ordhistorik för 9 000 uppslagsord.
Public domainSenSALDO — Språkbanken Text
Sentimentannoterade ordinnebörder (positiv/neutral/negativ) för 12 000 ingångar.
CC-BY 4.0Övriga källor
Swesaurus — Språkbanken Text
Synonymresurs från Språkbanken.
CC-BY 4.0eSpeak NG — eSpeak
Fonetisk transkription. Licensen gäller mjukvaran, inte genererat uttal.
GPL-3.0Open Multilingual Wordnet — Bond & Paik (2012)
Flerspråkigt wordnet.
CC-BY 3.0Så bygger vi ordboken
Ordsynonymer.se är inte en traditionell ordbok som skrivs för hand. Det är en kunskapsgraf — ett nätverk av ord, betydelser och relationer — som byggs upp systematiskt genom att sammanföra och korsvalidera akademiska datakällor.
Import med spårbarhet
Varje datakälla importeras via ett dedikerat importskript som loggar exakt vilka rader som lades till, när, och från vilken källa. Vi kan i efterhand visa exakt varifrån ett synonympar, en definition eller en relation kommer.
Korsvalidering
När samma ordpar dyker upp i flera oberoende källor stärker det kopplingen. Ett synonympar som finns i både SALDO och SynLex klassas högre än ett som bara finns i en enda källa. Vi kräver aldrig att en enskild källa ska vara perfekt — vi låter källorna komplettera varandra.
Kvalitetsklassning
Varje synonympar tilldelas en kvalitetsklass: Gold (verifierad av auktoritativ källa, 80 000 par), Silver (bekräftad av minst två källor, 130 000 par) eller Bronze (enstaka källa, 68 000 par). Klasserna styr vilka synonymer som visas först.
Automatiska kvalitetskontroller
Databasen kör dagliga kontroller som fångar självreferenser, dubbletter, ordklassmismatch och saknade attribut. Kritiska problem blockerar export till produktion.
Transparens
Varje synonym korsrefereras mellan källor för att verifiera att den faktiskt är en synonym. Vi härleder egna lemman, och bedömer styrkan i varje koppling — hur nära två ord ligger i betydelse. Resultatet är inte en rå databasdump, utan en granskad synonymordbok.
Hur vi skiljer oss
De flesta synonymordböcker på nätet bygger på en eller två källor och visar resultaten utan kontext. Vi gör det annorlunda:
Fler källor: 12 oberoende akademiska och lexikografiska datakällor istället för en.
Synlig kvalitet: Varje synonympar har en kvalitetsklass som förklarar hur säker kopplingen är.
Automatisk granskning: Dagliga kvalitetskontroller istället för manuell stickprovskontroll.
Öppen metodik: Vi förklarar exakt hur datan bearbetas — inte bara vad resultatet blir.
Fritt tillgängligt API: Utvecklare kan använda datan via vårt REST-API.
Redaktionen
Ordsynonymer.se drivs av en liten redaktion med bakgrund inom språkteknologi och webbutveckling. Vi bygger och underhåller den tekniska pipeline som sammanför, validerar och serverar synonymdata.
Vår roll är inte att skriva ordboken — det har de akademiska källorna redan gjort. Vår roll är att göra deras arbete tillgängligt, sökbart och kvalitetssäkrat i ett samlat gränssnitt.
Har du frågor, hittar du fel, eller vill du samarbeta? Kontakta oss på [email protected].
Källhänvisningar
Ordsynonymer.se använder följande resurser i enlighet med deras respektive licenser:
SALDO 2.3: Borin, L., Forsberg, M. & Lönngren, L. (2013). SALDO: a touch of yin to WordNet's yang. Language Resources and Evaluation, 47(4), 1191–1211. Språkbanken Text, Göteborgs universitet. CC-BY 4.0.
SynLex: Copyright (c) Viggo Kann, KTH, 2009. Fri användning med bevarad upphovsrättsnotis.
Folkets lexikon: KTH Nada. CC-BY-SA 2.5.
Wiktionary: Wiktionary-bidragsgivare via Kaikki-export (Tatu Ylonen). CC-BY-SA 3.0.
Språkbanken-resurser (BlingBring, SweFN 2.0, Kelly-listan, SenSALDO, Swesaurus): Språkbanken Text, Göteborgs universitet. CC-BY 4.0.
Hellquist: Elof Hellquist, Svensk etymologisk ordbok (1922). Public domain.
Open Multilingual Wordnet: Bond, F. & Paik, K. (2012). A survey of wordnets and their licenses. CC-BY 3.0.
eSpeak NG: Fonetisk transkription genererad med eSpeak NG. GPL-3.0 (licensen gäller mjukvaran, inte genererat uttal).