Íslenskur Orðasjóður

Leitarorð:
Leit í textagrunni: Allir textar/All texts
greina á milli lítils og stórs stafs í byrjun orðs
Textagrunnur:

Vertu velkomin/n á vefsíðu verkefnisins Íslenskur Orðasjóður

Verkefnið Íslenskur Orðasjóður var unnið við Háskólann í Leipzig á árunum 2001-2012 sem hluti af rannsóknavinnu við verkefnin Leipzig Corpora Collection og Íslensk tíðniorðabók.

Íslenskur Orðasjóður er textagrunnur með textum úr íslensku nútímamáli, sem samsettur er úr fimm mismunandi textagrunnum. Alls inniheldur textagrunnurinn tæplega 33 milljón setningar og 545 miljón lesmálsorð (eftir að eins setningar hafa verið fjarlægðar), þar af eru 6,7 miljón mismunandi orðmyndir. Tveir stærstu grunnarnir eru gerðir úr íslenskum textum úr vefsíðusöfnunum Landsbókasafns Íslands - Háskólabókasafns haustin 2005 og 2010.

Leitarglugginn er stilltur á leit í öllum textagrunnunum en einnig er hægt að leita sérstaklega í einstökum grunnum með því að smella á nafnið á þeim hér fyrir ofan: Ef þú vilt vita meira um Íslenska Orðasjóðinn þá skaltu smella hérna, ef þú vilt fá stuttar leiðbeiningar um hvernig hægt er að nota orðasafnið skaltu smella á takkann með spurningarmerkinu og ef þú vilt fá ýtarlegar leiðbeiningar þá skaltu smella hérna

Welcome to the corpus Íslenskur Orðasjóður

Íslenskur Orðasjóður is a very large Icelandic corpus of modern Icelandic that was compiled in the research projects Leipzig Corpora Collection and Frequency Dictionary Icelandic. The overall corpus of all texts consists of 5 different sub-corpora. It contains about 33 million sentences, 545 million running words and 6.7 million different word forms after removing duplicate sentences from the sub-corpora. The sub-corpora are based on the following: The software and the user interface were developed by the NLP Group at Leipzig University in the project Leipzig Corpora Collection. A special thank goes to the following sponsors for their financial and professional support to Íslenskur Orðasjóður: You can find more information about the Icelandic corpus in the following publications:
Are you looking for detailed information (in Icelandic)?