Huono hakumenetelmä vinouttaa tuloksia
Sanahaku on varsin suosittu Internetin tiedonhakumenetelmä. Se toimii niin, että tiedonhakija syöttää hakukoneeseen valitsemansa hakusanat, joiden mukaisesti hän saa hakutuloksia. Tulos on yleensä täysin mekaaninen: luetellaan kaikki ne sivut, jotka täyttävät hakukriteerin.
Sanahaun vitsauksena on satunnaisuus: epämääräisesti asetetut hakusanat vievät tiedonhakijan sivuraiteille, esimerkiksi sivuille, joilla asia mainitaan vain ohimennen tai joiden kirjoittaja ei tunne asiaa kovinkaan hyvin. Eri hakukoneissa eroja on siinä, millaisessa järjestyksessä tulokset esitellään. Google-hakukoneen käyttöön ottama arvojärjestys antaa etusijan niille sivuille, joihin on muilla www-sivuilla paljon viittauksia. Tällä tavoitellaan sitä, että ensimmäisenä mainitut sivut olisivat luotettavimpia ja arvostetuimpia alan lähteitä.
Nettitiedon haussa olisikin suosittava aihehakemistoja.
Vertaileminen
Vanhassa tutkielmien teko-ohjeessa vaaditaan, että työn pitää perustua useampaan kuin yhteen lähteeseen. Tällä on pyritty pois referaateista ja kohti lähteiden vertailemista. Internet-tiedon epätasaisuus tarjoaa usein koululaisellekin tilanteita, joissa on soviteltava ristiriitaisia tietoja yhteen. Lisätekijä on toisistaan riippuvien lähteiden runsaus: samaa tietoa toistetaan netissä hyvin usein. Näin ollen vanha ohje pätee yhä: yksi lähde ei riitä tutkielman tekoon.
Lähteiden keskinäiset suhteetkin olisikin otettava huomioon koulukirjoitelmissa. Koska Google-haku nimenomaan perustuu viittaussuhteiden luokitteluun, se saattaa olla muita hakukoneita parempi keskinäisten riippuvuuksien selvittelyssä. Sen related-toiminto (samankaltaisten sivujen etsintä) saattaa antaa valmiita vastauksia riippuvuussuhteisiin.
Teksti: Olli Lehtonen