Geokogude infosüsteem SARV

Alljärgnev tekst pärineb põhiosas järgmisest artiklist ning peegeldab 2008. a seisu:
Hints, O., Isakar, M., Hints, R. 2008. Eesti geoloogilised kollektsioonid [Geological collections in Estonia]. In: Parmasto, E., Viikberg, J. (eds). Eesti humanitaar- ja loodusteaduslikud kogud. Seisund, kasutamine, andmebaasid. Tartu Ülikooli Kirjastus, Tartu. 181-200.

Arvutiandmebaaside tõhusust geoloogiliste kogude haldamisel tajuti juba 1960–1970 (Brunton, 1979), kuigi nende laiem levik sai alguse alles koos personaalarvutite võidukäiguga 1980ndatel aastatel. Interneti ja veebiteenuste areng lõi omakorda eeldused selleks, et konkreetsed geoloogiliste kogude andmebaaside ka laiale teadlaste ringkonnale kättesaadavaks muuta (MacLeod ja Guralnick, 2000).

Eestis tehti geoloogiliste kollektsioonide ning seonduva info elektroonilisel haldamisel esimesed tõsised sammud 1994. a kui Tartu Ülikooli geoloogiamuuseumis võeti kasutusse Kultuuriministeeriumi tellimusel välja arendatud DataEase for DOS - põhine muuseumite infosüsteem ning sellest väljakasvanud Sybase-põhine KVIS (kultuuriväärtuste infosüsteem). Aastate jooksul digiteeriti enam kui 10 tuh mineraali ning 2 tuh kivistise info. Paraku osutus KVIS loodusteaduslike ning eriti geoloogiliste kogude haldamisel suhteliselt ebamugavaks mistõttu elektroonilise andmebaasi kasutegur jäi tagasihoidlikuks.

TTÜ Geoloogia Instituudis alustati elektroonilise kogude andmebaasi juurutamist mõnevõrra hiljem, 1996. a, kui konkreetse teadusprojekti raames ilmnes vajadus sorteerida ja filtreerida vanades paberkataloogides sisalduvat infot. Vajalike andmete leidmiseks oleks tulnud kataloog mitu korda rida-realt läbi vaadata ning otsitavad read ükshaaval välja kirjutada. Tollal ehk töömahukama kuid tulevikkuvaatava lahendusena digiteeriti paberkataloogi ligikaudu 7500 rida tabelarvutusprogrammide Lotus 1-2-3 ja Microsoft Excel abil. Need 12 a tagasi sisestatud andmed on läbi mitme riist- ja tarkvarasüsteemi alles ka tänases, oluliselt keerukama ehitusega andmebaasis ning ühtlasi kõigile huvilistele veebiliidese kaudu kättesaadavad.

Loogilise jätkuna ühe-tabeli-põhisele "lamedale" andmebaasile tekkis peatselt vajadus ka leiukohtade, puursüdamike, eksemplari-tasandil säilikute ning mitmesuguse muu informatsiooni talletamiseks elektroonilises süsteemis. Esimesed vastavad katsetused tehti 1998. a. kasutades arendusplatvormina Microsoft Access 97 andmebaasi. Järk-järgult arendatava infosüsteemi peamiseks eesmärgiks kujunes kuraatorite ning teadlaste igapäevase töö hõlbustamine. Seetõttu ei valitud ühtki valmis andmebaasi vaid asuti arendama oma süsteemi lähtudes reaalsest tööprotsessist ja konkreetsetest vajadustest. Süsteemi komponentide valikul sai määravaks süsteemi lihtsus, odavus, kiirus ja funktsionaalsus. Ainuõige lahendusena keskenduti andmete ja kasutajaliideste lahkuviimisele ning klient-server arhitektuurile. Sobivaimaks andmebaasiserveri tarkvaraks osutus vabavaraline MySQL (hetkel kasutuses versioon 5.0). Põhiliseks kasutajaliideseks jäi MS Access (algul versioon 97, praegu 2003), mis võimaldas minimaalsete programmeerimisoskuste juures luua piisava funktsionaalsusega andmesisestusvorme, päringuid ja aruandeid. Andmebaasiserveri ja kasutajaliidese ühendus on tagatud ODBC (MySQL Connector/ODBC 5.1) kaudu. Kohtvõrgus toimib andmevahetus otse ilma krüpteerimiseta; üle avaliku võrgu töötamisel krüpteeritakse ühendus standardse SSH-tunneli abil. Andmebaasi normaalseks tööks on vajalik vähemalt 2Mbit/s ühendus, soovitavalt 10Mb/s.

Geokogude infosüsteemi arhitektuur ja põhikomponendid.


Klient-server arhitektuur loob eeldused erinevate kasutajaliideste, sh veebipõhiste teenuste loomiseks. SARVe avalik veebiliides on programmeeritud PHP skriptikeeles. Ka osa asutusepoolsetest päringu- ning aruandefunktsioonidest on realiseeritud veebipõhiselt ning tulevikus on plaanitud selliste funktsioonide osakaalu suurendada. Geoinfoga (koordinaatidega) varustatud andmeid on võimalik kuvada veebipõhise kaardiserveri kaudu (MapServer ja PHPMapScript); samuti on võimalik kaardiandmetest standardse Google Earth kml faili tekitamine ning kaardipunktide kuvamine Google Maps teenuse abil.

Omaette kasutajaliidesena võib käsitleda ka BioCASEi ja GBIFi andmetarnijaid — need on serveripõhised programmid, mis vastavalt seadistatuna võimaldavad mittestandardse andmebaasi väljadest moodustada standardsed andmevood, mille kaudu toimib ühendus rahvusvaheliste andmevõrgustikega.

Hetkel koosneb geokogude infosüsteemi täisversioon enam kui 90st omavahel seotud andmetabelist, millest olulisemad on eksemplari, kollektsiooni, proovi, puursüdamiku, preparaadi, määrangu, leiukoha, stratigraafia, klassifikatsiooni, isiku, kirjanduse, asukoha, laenu jne tabelid. Põhjalikumalt on neid ning nendevahelisi seoseid iseloomustatud infosüsteemi kodulehel (sarv.gi.ee).

2003. a alustati infotöö alast koostööd TTÜ GI ja ELMi vahel, tehti esimesed katsetused sama süsteemi kasutusvõimaluste selgitamiseks Eesti Loodusmuusemis. Edukalt kulgenud katsetused viisid 2005. a spetsiaalselt muuseumile kohandatud versioonini, samuti valmis lihtne veebipõhine kasutajaliides. Kogude programmi toel peaks Loodusmuuseumi geoloogilised kogud olema andmebaasistatud 2008. a lõpuks. TTÜ GI-s on digiteeritud ligikaudu 150 000 säiliku info. 2006. a võeti infosüsteem kasutusele ka TÜ geoloogiamuuseumis, kus praeguseks on sisestatud ning veebilehel nähtavad enam kui 8000 kirjet.

Oluline on märkida, et geokogude infosüsteemi andmete, sh täisresolutsiooniga pildimaterjali kasutamine on mitteärilistel eesmärkidel kõigile vaba. Kasutatavad nn Creative Commons'i litsentsitingimused (vt www.creativecommons.org) lubavad materjale ka töödelda ning levitada tingimusel, et viidatakse algallikale. Esimesed näited on olemas ka materjali kommertskasutusest — sel juhul lepitakse tingimustes eraldi kokku.

Infosüsteemi arengu kronoloogia

  • 1996 - Esimesed sammud kollektsioonide digitaalseks registreerimiseks kasutades tabelarvutusprogramme Lotus 1-2-3 ja MS Excel
  • 1998 - Algne versioon kogude andmebaasist MS Access 97 tarkvara baasil
  • 2000 - MS Access'i mitmekasutaja süsteem (tuginedes andmefaili jagamisel MS Windows'i kohtvõrgus)
  • 2002 - MySQL andmebaasiserveri tarkvara kasutuselevõtt MS Windows platvormil
    Esimene tõsiseltvõetav avalik veebipõhine kasutajaliides päringute koostamiseks, algne kaardiserver ruumiandmete kuvamiseks
  • 2003 - Infotööalane koostöö ja katsetused andmebaasi rakendamiseks Eesti Loodusmuuseumis
    Liitumine BioCASE võrgustikuga (esimene eksemplari-tasandi andmetarnija Eestis)
  • 2004 - Serverarvuti soetamine KIKi projekti "Geokogude infosüsteem" toel, tarkvara seadistamine Linuxi operatsioonisüsteemile (Red Hat Enterprise)
    Nimetuse "SARV" kasutuselevõtt infosüsteemi tähistamiseks
    Uuendatud funktsionaalsusega ja varasemast universaalsem veebipõhine kasutajaliides
  • 2005 - Andmebaasi kohandamine tööks Eesti Loodusmuuseumi geoloogia osakonnas ning vastava kataloogi veebiliidese loomine
    Üleminek serveris Debian Linux operatsioonisüsteemile
  • 2006 - Esimesed katsetused infosüsteemi käivitamiseks Tartu Ülikooli geoloogiamuuseumis
  • 2007 - Ruumiandmete sidustamine Google Maps teenusega ning ID-kaardi autentimisvõimaluse lisamine veebiliidesele
  • 2008 - Pildipanga funktsioonide lisamine, veebiliidese täiustamine ja veebipõhiste aruandlusvormide laiendamine, kirjanduse seostamine DOI indeksitega jms
  • 2010 - Liitumine rahvusvahelise GeoCASe andmevõrgustikuga
  • 2011 - Infosüsteemi riistvara täiendamine KIKi projekti toel ja tarkvaraarendused, veebipõhise andmesisestusliidese prototüübi loomine