AIHEET ARKISTO TIETOA TÄSTÄ BLOGISTA

Blogi paikoista, tavaroista, uskomisista, syömisistä, webistä ja muustakin

Kaikki suomen sanat aakkosesta öylättiin

7.8.2010 klo 8.37 | Niko Lipsanen

aiheet kulttuurit,

Kotimaisten kielten tutkimuskeskukseen (Kotus) julkaisemassa nykysuomen sanalistassa on 94 110 sanaa. Aakkosissa ensimmäisenä on aakkonen ja viimeisenä öylätti. Listan lienee kätevä esimerkiksi sanojen oikeinkirjoitusta tarkistettaessa. Sanalistan voi hakea Kaino-aineistopalvelun sivuilta xml-muotoisena. Tiedosto sisältää itse sanojen lisäksi tietoa esimerkiksi sanojen taivutuksesta ja astevaihtelusta.

Sanalistan voi hakea myös Vesa Linja-ahon blogimerkinnästä. Linja-aho on puhdistanut listasta oheistiedot ja xml-merkkauksen, ja jättänyt jäljelle pelkän sanalistan txt-muodossa. Tuon blogimerkinnän kautta itsekin listan juuri äsken löysin.

Homonyymit esiintyvät listassa kahtena tai useampana kopiona. Homonymia tarkoittaa siis tässä yhteydessä sitä, että usealla eri asiaa tarkoittavalla sanalla on yhteinen kirjoitusasu. Sanan kirjoitusmuoto esiintyy siis listauksessa yhtä monta kertaa kuin sillä on eri merkityksiä (esim. kuusi on listassa kahdesti).

Listaa on mielenkiintoista tutkia. Eräs lautapeli kirjoitetaan näköjään suomeksi šakki, mutta hiustenpesuun käytettävä aine on kuitenkin sampoo. Vaikuttaa epäjohdonmukaiselta, mutta ehkä siihen on jokin selitys.

Mukana on myös sanoja, joita en tiennyt suomen kielessä esiintyvänkään. Hassi ei ole vain sukunimi, vaan se myös tarkoittaa jotakin (Urbaanin sanakirjan mukaan joko epäonnistumista tai harmaasieppoa). Sana ainian taas on ilmeisesti vanhahtava, mutta edelleen hyväksytty, versio sanasta ainiaan.

Oikeinkirjoituksen kannalta mielenkiintoista on myös, että sikanauta kirjoitetaan yhteen ilman väliviivaa, mutta sika-nautajauheliha väliviivan kanssa.

On myös hyvä tietää, että sekä peffa että pehva ovat hyväksyttäviä suomenkielisiä sanoja. Talvisista ulkoilmaharrastuksista löytyy kuitenkin vain peffamäki. Pehvamäkeä sanalista ei tunne.

Mielenkiintoista on myös, että pakkoruotsi on päässyt sanalistaan mukaan. Muitakin pakkoja listalla on, mutta ei usein pakkoruotsikeskustelun yhteydessä esiin nostettuja pakkoliikuntaa, pakkomatematiikkaa, pakkouskontoa tai mitään muutakaan pakko-oppiainetta.

Kotuksen sivuilla kylläkin painotetaan, ettei sanalista ”ole tyhjentävä tai auktoritatiivinen luettelo suomen kielen sanoista”, vaan apuväline. Jostakin se varmaan silti kertoo, että oppiaineista vain ruotsi on päässyt mukaan pakko-alkuisten yhdyssanojen listalle.

Erisnimiä listassa ei pääsääntöisesti ole, mutta jostakin syystä ainakin Ahti on päässyt mukaan.

Listan kanssa saisi varmasti vietettyä aikaa pidemmänkin tovin.

Yksi kommentti tai paluuviite

  1. Santeri 3.2.2011 klo 1.53:

    Sampoo on epäjohdonmukaisuus. Kielenhuollon satavuotinen perinne pyrkii ohjaamaan uudempien lainain vakiintumista niin, ettei sanan sisälle muodostuisi ”ruotsalaisen” kuuloisia geminaattakonsonantteja. Pääsääntönä on, että sisäkonsonantin kahtena kirjoittaminen sallitaan vain jo suomen kieleen vakiintuneissa sanoissa, joitten äänneasun ei enää katsota voivan muuttua, eli joitten osalta peli on ikään kuin menetetty. Samppanja katsotaan tällaiseksi sanaksi, mutta jostain syystä sampoota ei katsota.

    Minä kyllä väittäisin, että sampoo kuuluu niin nesteenä kuin sananakin suomalaisen elämään jo kiinteämmin kuin samppanja, joten saman periaatteen mukaan sekin pitäisi kirjoittaa pp-llisenä. Jos sitä edelleen pitäisi vierassanana, sen voisi kirjoittaa *shampoo*, mutta kun sana on kotiutunut lainana eli kieleen vakiintunut, se pitäisi ottaa mukaan fonologisella (kirjain vastaa äännettä) periaatteella toimivan oikeinkirjoitussysteemin piiriin. Tällöin sen pitäisi olla *šamppoo* tai *samppoo*. Sen sijaan *sampoo/šampoo* on anomalismi, tarpeeton sekamuoto.

    Muuten systeemin ulkopuolelle vakiintuneet sanat nakertavat koko systeemiä, niin että fonologinen periaate vähittäin korvautuu etymologisella (eli sanat kirjoitetaan niin kuin lainanantajakielessä), jollainen on käytössä esim. ruotsissa ja englannissa, ja joka on sekä koululaiselle että ulkomaalaiselle vaikeampi oppia.

    Tavallisella ässällä voi kirjoittaa sanat samppanjat ja samaanit lähinnä siksi, että iso osa suomalaisista ei ole vielä oppinut š:ää ääntämäänkään. Niistä, jotka ovat, tuo kirjoitusasu näyttää kai juuri siitä syystä junttimaiselta. Puhuvathan monet suomalaiset panaaneista ja pingostakin vaikkeivät niin kirjoita. Toisaalta juuri se, että š:ää ei oikeastaan vaadita kirjoittamaan juuri muussa kuin vierasperäisissä nimissä, on monille luonut käsityksen, ettei koko kirjain edes kuulu suomen kieleen. Luulenkin, että vain š:n johdonmukainen vaatiminen noita sanoja kirjoitettaessa toisi sille vähitellen yleisen hyväksynnän suomen aakkoston osana, olkoonkin että ensi alkuun se herättäisi vastustusta.

Tätä artikkelia ei ole enää mahdollista kommentoida (eikä mitään muutakaan artikkelia tässä blogissa). Blogi on arkistoitu, eikä sitä enää päivitetä.

2018 2017 2016 2015 2014 2013 2012 2011 2010 2009 2008

Artikkeleiden aiheet:

Etusivu : 2010 : Kaikki suomen sanat aakkosesta öylättiin

Kaikki blogin artikkelit yhdellä sivulla

Siirry sivun ylälaitaan