Googlettamista vai tiedonhakua?
Ari Haasio
Googlen suosio on suuri. Yhtiön oman ilmoituksen mukaan peräti 98 prosenttia suomalaisista netin käyttäjistä hyödyntää Googlea tiedonhaussa (Tietoviikko 1.2.2008). Googlettamisesta on muodostunut tiedonhaun synonyymi. Ilmaus kuvaa hyvin Googlen valta-asemaa ja merkitystä etsittäessä informaatiota verkosta. Riittääkö Google vai tulisiko meidän hallita muitakin menetelmiä etsiessämme informaatiota Internetistä?
Kansalliskirjaston ylikirjastonhoitaja Kai Ekholm (2008) on todennut, että maahamme on kasvamassa Googlen ja Wikipedian kyllästämä sukupolvi, jonka yksipuolinen lähteiden käyttö ja kritiikittömyys ovat omiaan vääristämään tiedonkuvaa. Jos tietämyksemme perustuu yksinomaan Googlen ja Wikipedian tarjoamaan informaatioon, vaarana on helposti saadun informaation pintapuolisuus ja sirpaleisuus.
Edellä mainittua ei pidä ymmärtää hyökkäykseksi Googlea tai Wikipediaa vastaan vaan pikemminkin huoleksi siitä, että verkkolähteiden käyttötaito on yksipuolista. Google on hyvä hakukone, mutta sen avulla ei suinkaan saavuteta läheskään kaikkea verkossa olevaa informaatiota – mikään hakupalvelu ei kykene siihen. Lisäksi meidän tulisi opetella käyttämään Googlea – googlettaminen ei ole tiedonhakua vaan summittaista tiedonetsintää verkosta. Hyvin ja perusteellisesti tehty tiedonhaku on suunnitelmallista toimintaa, jossa hakija miettii huolella hakukäsitteet, niiden väliset suhteet, käytettävän hakumenetelmän ja niin edelleen. (esim. Haasio 2008).
Hakukoneiden tekemät haut kohdistuvat nk. pintawebiin, eivät koko verkkoon. Iso osa verkossa olevasta informaatiosta on syvässä webissä (deep web)i, joka on hakukoneiden ulottumattomissa. Esimerkiksi monet tietokantojen sisällöt ovat esimerkkejä sen tyyppisistä sisällöistä, joita ei kyetä löytämään hakukoneiden avulla. Syitä siihen ettei hakukone löydä haluttua informaatiota on toki paljon muitakin. Esimerkiksi linkkien puuttuminen, harvinaisemmat tiedostomuodot , jne. ovat tyypillisiä syitä siihen etteivät hakukoneet löydä syvän webin alaisuuteen kuuluvia sivustoja. (Sherman & Price 2002).
Tiedonhaku on ennen muuta luovaa toimintaa. Se vaatii mielikuvitusta ja kykyä lähestyä hakuongelmaa eri näkökulmista. Alasuutari (1989) on verrannut tutkimustyötä salapoliisin työhön, voidaan myös tiedonhausta perustellusti käyttää samaa vertauskuvaa. Kyky käyttää luovasti eri hakumenetelmiä, taito löytää oikeat hakutermit sekä ennen muuta monipuolinen ja kriittinen lähteiden käyttötaito ovat salapoliisin työtä parhaimmillaan. Usein hakija joutuukin etsimään informaatiota verkosta useista lähteistä, kokoamaan niiden avulla palapelin ja jäljittämään puuttuvia tiedonmurusia hyvin monin eri tavoin. Tiedonhaun suurimpana ongelmana voidaankin Chun (2003) mukaan pitää sitä, kuinka oikea informaation löydetään oikealle käyttäjälle oikeaan aikaan. Viime kädessä kyse on hakulausekkeen muotoilusta ja rajauksesta: se kuinka määrittelemme haluamamme informaation sisällön hakukoneelle, ratkaisee haun onnistumisen.
Monipuolisuus on yksi hyvän tiedonhakijan ominaisuuksista. Se on osa informaatiolukutaitoa, jota jokaiselta meistä voidaan edellyttää osana kansalaisen perusosaamista ja ammatillisten valmiuksien kehittämistä. Siksi on tärkeää osata muodostaa ja tehdä hakuja eri menetelmiä käyttäen, rajata niitä ja tuntea vaihtoehtoisia menetelmiä ja verkkolähteitä oikean informaation löytämiseksi.
Verkon monet välineet
Verkossa on valtaisa määrä erilaisia tiedonhaun välineitä: sanahakukoneita, metahakuja, hakemistoja, erikoishakuja, luetteloita ja niin edelleen. Esimerkiksi metahaut mahdollistavat yhtäaikaisen haun eri hakukoneista. Samalla metahaut valikoivat myös vain muutamasta kymmenestä muutamaan sataan lähdettä hakutulokseen omien algoritmiensa perusteella niin, että vain osuvimmat hakutulokset tulevat lopulliseen tulokseen. Tämä helpottaa hakutulosten arviointia ja läpikäyntiä huomattavasti. Tunnetuimpia metahakukoneita ovat Clusty, Dogpile, Mamma ja Ixquick. Esimerkiksi Clusty jaottelee kaikki hakutulokset automaattisesti sivun aiheen mukaan. (Haasio 2008).
Google on kehittänyt palveluunsa useita erilaisia erikoishakuja (GoogleNews, GoogleScholar, GoogleBlogs jne.). Monet niistä ovat varsin hyviä apuvälineitä, mutta eivät välttämättä aina riittäviä. Myöskään perinteiset artikkelitietokannat, kuten Emerald, CSA tai Ebsco, eivät aina ole hakutehtävään soveltuvia. Hakumenetelmä onkin valittava tapauskohtaisesti.
Eräät aihehakemistot ja hakukoneet ovat keskittyneet tieteelliseen tietoon. Esimerkkinä tällaisista palveluista voidaan mainita Infomine ja Intute. Jälkimmäinen on brittiyliopistojen yhteinen aihehakemisto, johon on valittu vain ja ainoastaan sellaisia linkkejä, joita asiantuntijat pitävät soveltuvina opiskelu- ja tutkimuskäyttöön. Edellinen taas on puhtaasti tieteelliseen tietoon erikoistunut verkon hakukone. Otetaan esimerkki: jos opiskelija etsii informaatiota Platonista, niin perusgoogletuksella saadaan miljoonia tuloksia ja sekaan mahtuu paljon epärelevantteja sekä tiedon alkuperän kannalta arveluttavia linkkejä. Mikäli tiedonhakuun käytetään esimerkiksi Intutea, hakutulos sisältää alle sata linkkiä eri sivustoihin, joita brittiyliopistojen yhteinen hakemisto pitää opiskelukäyttöön sopivina ja sisällöltään luotettavina.
Oman lisänsä tiedonhakuun tuo web 2.0–ilmiö. Sosiaalisen webin myötä myös tiedonhaku muuttuu: konstruktivistisen ideaalin mukaisesti käyttäjät luovat yhdessä tietoa esimerkiksi Wikipediassa tai Knolissa. Ajatus on kaunis, mutta siinä piilee myös tiettyjä vaaroja: yhteisöllinen tiedon luominen ei välttämättä johda tasokkaimpaan mahdolliseen informaatioon, sillä tiedon tuottajina eivät aina toimi alansa parhaat asiantuntijat. Tämä on aiheuttanut sen, että sosiaalisen median tuottama informaation on paikoitellen tasoltaan hyvin kirjavaa. Tuominen (2008) on kuitenkin huomauttanut aiheellisesti sosiaalisen median itse itseään kontrolloivasta vaikutuksesta esimerkiksi Wikipedian osalta. Käytännössä tämä tarkoittaa sitä, että yhteisö pyrkii itse korjaamaan havaitsemansa virheet.
Mitä hakutermejä valittaessa on huomioitava?
Onnistunut tiedonhaku koostuu monista eri osatekijöistä. Aivan ensiksi on syytä päättää hakustrategia eli lähestymistapa siihen kuinka suoritamme haun. Hakustrategia kuuluu mm. ongelman jäsentäminen, hakutermien valinta ja tiedonlähteen valinta. Tämän jälkeen hakua edistetään erilaisilla hakutaktisilla siirroilla, kuten haun rajaamisella eri menetelmillä, hakutermien lisäämisellä tai vähentämisellä jne.
Eri hakukoneissa ja tietokannoissa on erilaisia mahdollisuuksia rajata hakua. Rajausmahdollisuudet vaihtelevat mm. kielen, maan, tiedostomuodon jne. rajausmahdollisuuksista aina sisältötyyppien (esim. kokoartikkelit) rajaamiseen.
Ehkä keskeisin haun lopputulokseen vaikuttava asia on kuitenkin hakutermien valita (vrt. Belew 2000), jolloin Järvelinin (1993, 1995) mukaan pohdittava termien välisiä suhteita käsitetason, ilmaisutason ja merkkijonotason näkökulmasta. Käsitetasolla tarkastellaan halutun dokumentin ja sitä kuvaavien käsitteiden välisiä suhteita. Ilmaisutaso eli lingvistinen taso tarkastelee käsitteiden ilmaisutapoja luonnollisessa kielessä tai jossain erikoiskielessä kuten dokumentaatiokielessä. Merkkijonotasolla taas pohditaan sitä, kuinka käsite- ja ilmaisuanalyysin avulla valitut termit saatetaan esimerkiksi Boolen logiikkaa käyttäen hakulausekkeen muotoon. Tämä pätee yhtä lailla sanahakukoneilla kuin tietokannoistakin suoritettaviin hakuihin.
Haku on siis tehtävä kulloinkin tarkoituksenmukaisilla termeillä. Belew (2000) on kiinnittänyt huomiota muun muassa siihen mitä termejä tiedon tuottaja ja tiedon tarvitsija käyttävät samasta asiasta. Esimerkiksi synonyymien ja homonyymien huomiointi on yksi keskeisistä asioista hakutermejä valittaessa. Belewin (2000) mukaan kyse on pitkälti tarkoituksen ymmärtämisestä: mitä dokumentti todellisuudessa sisältää?
Hakutermien ideoinnissa on syytä pitää mielessä se, käytetäänkö kontrolloituun asiasanastoon kuuluvia asiasanoja vai ei. Jos esimerkiksi käytämme hakujärjestelmässä käytettävää asiasanastoa, haku kohdistuu kuvailuun, ts. tulokseksi saadaan niitä dokumentteja, jotka on kuvattu asiasanastoon valitulla ko. asiasanalla. Vapaasanahaku taas on laveampi ja siinä voidaan käyttää mitä tahansa luonnollisen kielen termiä.
Koska Internetistä tehtävässä tiedonhaussa käytetään ensisijaisesti luonnollista kieltä, asiaan liittyy runsaasti ongelmia, jotka on syytä tiedostaa hakua tehtäessä. Homonyymien ja synonyymien lisäksi kiertoilmaukset, anaforiset ilmaukset, hyponymiat ja sanojen taivutusmuodot vaikuttavat haun onnistumiseen. Suomen kielen rikkaus on sen monimerkityksellisyys ja vivahteikkuus – valitettavasti vain se tekee usein tiedonhaun haasteellisemmaksi.
Kaikki edellä esitetyt sanahaun muotoiluun liittyvät perusasiat olisi syytä tiedostaa ja huomioida esimerkiksi silloin, kun tehdään hakuja perinteisillä sanahakukoneilla, kuten vaikkapa Googlella. Tarkennettu haku antaa tähän melko hyvät mahdollisuudet.
Tiedonhaun opetuksen merkitys
Eräissä verkkoresurssien käyttöä koskevissa jäsennyksissä (esim. Hughes 2006) tiedonkäyttäjä nähdään ensisijaisesti oppijana. Karin (2007) mukaan tiedontarve virittää tiedonhankinnan, joka johtaa tiedonkäyttöön jolloin yksilö tai ryhmä prosessoi hankkimistaan lähteistä löytämäänsä informaatiota tiedoksi. Onnistunut tiedonhankintaprosessi ja siihen sisältyvä menestyksekkäästi tehty tiedonhaku on siis keskeinen osa tuloksellista oppimista.
Valitettavan usein opiskelijat valitsevat edellä mainitun Ekholmin (2007) mainitseman tien: googlettaminen ja Wikipedian käyttö opiskeluun on nopea ja helppo tie löytää ainakin jotain asiaan liittyvää ilman suurempia ponnisteluja. Perusteellinen tiedonhaku jää monta kertaa tekemättä ja valitettavan usein siihen ei edes ole valmiuksia. Kämäräinen (2008) on todennut ammattikorkeakouluopiskelijoiden lähteiden käytöstä omiin havaintoihinsa perustuen, että ”vaadittava määrä viittauksia tehdään ohjeiden mukaan ja sen jälkeen työskentelyorientaatiossa tapahtuu selkeä muutos copy-paste -menettelyyn”. Tämä kuulostaa pelottavalta kun asiaa tarkastellaan laajemmassakin kontekstissa. Työelämän kannalta monipuolinen informaatiolukutaito on ehdoton työelämässä menestymisen edellytys (esim. Hakala & Puttonen 2008).
Tiedonhaun- ja hankinnan opetus on rakennettu sisään ammattikorkeakoulujen opetussuunnitelmiin. Kaikki opiskelijat saavat johdatusta monipuolisen tiedonhaun tekemiseen, eri lähdetyyppeihin jne. Useimmiten tästä koulutuksesta vastaa asianomaisen oppilaitoksen kirjasto. Siitä huolimatta opiskelijoiden tiedonhakutaidoissa on paljon puutteita. Vika ei suinkaan ole kirjastojen. Ne tekevät hyvää työtä, mutta esimerkiksi annetut ajalliset resurssit ovat melko vähäisiä. Tiedonhaun opetusta on integroitu ammattiaineiden opetukseen, mikä on hyvä kehityssuunta. Edellä esitetyt perusasiat täytyy kuitenkin opettaa ensin ja niille on varattava tarpeeksi aikaa. Samalla myös meidän opetussektorilla työskentelevien asiantuntijoiden on hyvä katsoa peiliin alasta riippumatta ja kysyä: osaammeko me itsekään loppujen lopuksi hakea tietoa tarpeeksi monipuolisesti ja tehokkaasti?
Jos tiedonhaun osaaminen käsitetään itsestäänselvyydeksi, tehdään karhunpalvelus koko kansakunnalle. Tällöin ollaan matkalla kovaa vauhtia Ekholmin pelkäämään googlettavan wikipediasukupolven maailmaan. Meidän tulee – niin opiskelijoiden kuin opettajienkin – muistaa, että Googlen ulkopuolellakin on elämää!
Lähteet
Alasuutari, P. 1989. Erinomaista, rakas Watson: johdatus yhteiskuntatutkimukseen. Helsinki: Hanki ja Jää.
Belew, R.K. 2000. Finding Out About: A Cognitive Perspective on Search Engine Technology and the WWW. Cambridge: Cambridge University Press.
Chu, H. 2003. Information Representation and Retrieval in the Digital Age. ASIST Monograph series. Medford, NJ: Information Today Inc.
Ekholm, Kai. 2008. Google generation – menetetty tapaus? Uusi Suomi 31.1.2008. Verkossa http://www.uusisuomi.fi/nakokulmat/kaiekholm/google-generation-%E2%80%93-menetetty-tapaus#comments (Luettu 7.4.2009)
Google tavoittaa 98 prosenttia suomalaissurffaajista. Tietoviikko 1.2.2008. Verkossa http://www.tietoviikko.fi/kaikki_uutiset/article137842.ece. (Luettu 8.4.2009)
Haasio, Ari. 2008. Kaikki irti Internetistä. Helsinki: BTJ Kustannus.
Hakala, Hellevi & Puttonen, Kaisa. 2008.Kun korvantaustoja kuumottaa: Tiedonhankinta työelämässä. Osaaja.net 4/2008. Verkossa http://ojs.seamk.fi/index.php/osaaja/article/view/173/349 (käytetty 29.4.2009).
Hughes, H. 2006. Responses and influences: A model of online information use for learning. Information Research 12. Verkossa http://InformationR.net/ir/12-1/paper279.html (käytetty 29.4.2009).
Järvelin, K. 1993. Merkkijonot, sanat, termit ja käsitteet informaation haussa. Kirjastotiede ja informatiikka 12(4), 119-128.
Järvelin, K. 1995. Tekstitiedonhaku tietokannoista. Espoo, Finland: Suomen ATK-kustannus.
Kari, Jarkko. 2007. Conceptualizing the personal outcomes of information. Information Research 12. Verkossa http://InformationR.net/ir/12-2/paper292.html (käytetty 29.4.2009).
Kämäräinen, Juha. 2008. Informaatiolukutaidosta tiedonhallintataitoihin - sillanrakennusta vai rajatoraa? Osaaja.net 4/2008.
Sherman, Chris & Price, Gary. 2002. The Invisible Web: Uncovering Information Sources Search Engines Can’t See. Medford, NJ: CyberAge Books.
Tuominen, K. 2008. Tiedon partaalla: kuinka hallita informaatiotulvaa. Helsinki: BTJ Kustannus.
Artikkelissa mainitut verkkosivustot:
Google – http://www.google.fi
Dogpile – http://www.dogpile.com
Clusty - http://clusty.com/
Ixquick - http://ixquick.com/
Mamma – http://www.mamma.com
Intute – http://www.intute.ac.uk
Infomine - http://ixquick.com/
Knol - http://knol.google.com/k
Wikipedia - http://fi.wikipedia.org/wiki/Wikipedia:Etusivu