Kooperácia a prepojenie informačných, počítačových a komunikačných technológií - základné zdroje informácií pri zostavovaní tezauru
Mgr. Alena Zuzánková
Rozhodnutie riešiť projekt, s cieľom zostaviť komplexnú zostavu riadeného slovníka – tezauru – , bolo podložené existenciou funkčného informačného systému, ktorý poskytuje užívateľom odborné informácie v celom rozsahu; od signálnych informácií, cez rôzne druhy rešerší, až po študijné a rozborové materiály. Vytvorenie spätných väzieb a spolupráca s používateľmi informácií udržiava informačný systém aktívny pri riešení výskumných a projektových úloh, vrátane plnenia požiadaviek používateľov z podnikateľskej sféry. Ďalším dôvodom riešenia zostavy komplikovaného informačného materiálu - tezauru - je posun k zjednoteniu terminológie. Vývoj celulózo – papierenskej terminológie je historicky, jazykovedne aj odborne, poznačený existenciou niektorých termínov, ktoré sú z hľadiska súčasnej úrovne vedy a techniky už neaktuálne. Podobný informačný materiál je v súčasnosti v tomto regióne a pre danú vednú oblasť, nedostupný.
Informačné zázemie pre uvedené práce poskytujú predchádzajúce aktivity strediska VTEI pri VÚPC a.s. v súvislosti s budovaním fondu informačných zdrojov a vlastnej bázy dát (ADIS CELPA). Uvedené činnosti tvoria základné piliere informačného systému poskytovania informácií s orientáciou na celulózo - papierenskú problematiku a príbuzné oblasti zamerané na spracovanie drevnej hmoty.
Rozsiahly fond informačných zdrojov knižnice VÚPC tvorí významnú informačnú základňu pre dané vedné zameranie. V súčasnosti prebieha digitalizácia fondu informačných zdrojov priebežne doplňovaných do fondu, ale aj starších informačných materiálov po odbornom posúdení ich aktuálnosti . Budovaná e – knižnica VÚPC poskytuje prostredníctvom internej počítačovej siete LAN a výkonného serveru flexibilnejší prístup používateľom k informáciám priamo cez osobné počítače a súčasne poskytuje bezpečné uloženie firemných a knižničných dát. Priečinková štruktúra servera je rozdelená na dve vetvy, z ktorých jedna slúži na ukladanie a uchovanie odborných informačných materiálov , ako sú knihy, konferenčné materiály, časopisy, vlastný recenzovaný časopis Wood Research a i. Druhá vetva je určená na ukladanie firemných dát. Jednoduchší a produktívnejší prístup ku skenovaným informačným materiálom sa dosahuje spracovaním do formátu pdf pomocou multifunkčnej softvérovej aplikácie ABBY FineReader OCR. Jednoduchší prístup k najnovším informačný zdrojom sa intenzívne využíva pre potreby aktualizácie termínov v tezaure . Možnosti vstupov do fulltextových článkov pomáhajú priebežne objasňovať prípadné nejasnosti pri zaraďovaní termínov do tematických skupín, pri overovaní vzájomných vzťahov a pri vkladaní do hierarchickej štruktúry tezauru.
V rámci prípravných prác spojených so zoskupením termínov do tezauru, zameraného na technické vedy a so širokým rozsahom odborne a tematicky rôznorodých informácií, určená ISO norma 2788 odporúča celý súbor rozdeliť na tematické skupiny (TS) s obsahom hesiel a viacslovných termínov s príbuzným technologickým a tematickým zameraním. Rozdelenie komplexu informácií na tematické skupiny (TS) by mal optimálne pokryť celý rozsah problematiky daného vedného odboru. Určenie obsahovej náplne tematických skupín na zatrieďovanie kľúčových slov a viacslovných termínov sa uskutočnilo na základe vlastných skúseností z praktického poskytovania a triedenia informácií pre užívateľov informácií a súčasne aj s informačnou podporou zahraničných, profesionálne príbuzných informačných stredísk, ktoré majú skúsenosti s budovaním podobného materiálu , hlavne z krajín s rozvinutým celulózo-papierenským priemyslom (Nemecko, Kanada, Fínsko atď.).
Ďalšia fáza riešenia bola zameraná na využitie produktov knižničného počítačového softvéru WinISIS, ktorý poskytuje súhrnné súbory v podobe slovníkov (zoznamy autorov, kľúčových slov, zdrojov informácií ai.). Pre budovanie tezauru je z uvedených súborov najvýznamnejší súbor hesiel – kľúčových slov – s vyznačením frekvencie ich výskytu v odbornej literatúre. Frekvenčný slovník sa stal, po viacnásobných prehodnoteniach a úpravách, jedným z hlavných kritérií v procese začlenenia termínu do tezauru. Frekvencia výskytu daného termínu je meradlom jeho aktuálnosti v danom sledovanom období. Spracovanie najnovších prírastkov v odbornej literatúre do e-knižnice a do bázy dát (skenovanie, anotácia) je spojené so získaním podkladu o aktuálnosti a odbornej náplni novovzniknutého termínu. Práca s informačnými materiálmi e-knižnice je podstatne uľahčená existenciou internej počítačovej siete s priamymi vstupmi pracovných počítačov. Uvedené postupy prác pomáhajú optimálne začleniť každý hodnotený odborný termín do hierarchickej štruktúry tezauru, t. zn. zaradiť do jednej z 15 tematických skupín, vytvoriť vzájomné väzby nadradenosti (ŠT - Širší Termín), podradenosti (UT - Užší Termín) a príbuznosti (PT – Príbuzný Termín). Pri uvedenej činnosti sa musia zohľadňovať väzby, ktoré vznikajú medzi termínmi v rôznych stupňoch technologických procesov výroby a spracovania produktov celulózo-papierenského priemyslu. Akákoľvek zmena v pracovných súboroch na základe odborného posúdenia sa spätne musí doplniť na všetkých úrovniach hierarchickej štruktúry termínov. Čiže každý vklad a úprava termínu v tezaure vyžaduje priebežne komplexnú prácu s celým súborom pracovných zostáv.
Pri overovaní odbornej náplne termínov, prípadne ich jazykovednej správnosti a hľadaní informácií v elektronicky vzdialených informačných zdrojoch sa intenzívne využívajú všetky dostupné komunikačné technológie, hlavne vstupy na internet, využívanie elektronických zdrojov s príbuznou tematikou, kooperácia s informačnými strediskami, atď.
Okrem knižničného softvéru WinISIS, so zameraním na spracovanie textovo rozsiahlych informácií a tvorbu báz dát, pri zostavovaní tezauru sa využívajú ďalšie počítačové softvéry aplikované pre vytvorenie abecedne rozdelených pracovných zostáv z dôvodu lepšej orientácie a prehľadu vo veľkom balíku informácií. Prekonvertovaním frekvenčného slovníka získaného softvérom WinISIS a následnou aplikáciou softvéru MS Office Excel sa získali abecedne zoradené pracovné zostavy. Týmto postupom sa spracovalo cca 3500 termínov do 21 pracovných zostáv termínov v abecednom poradí. Podľa dohodnutej hierarchickej štruktúry termínov sa u každého termínu vyznačia vzájomné väzby medzi termínmi, na základe ich technologického a tematického zamerania.
Na priebežné kontroly tlačových výstupov jednotlivých pracovných zostáv bol aplikovaný softvér MS Office Access. Rovnakým postupom bude optimalizovaný aj dizajn konečnej printovej verzie frekvenčného slovníka.
Rozsah využitia tezauru pri plnení rôznych požiadaviek používateľov informácií je široký a spĺňa potreby na viacerých úrovniach informačného zabezpečenia. Zjednotenie terminológie v tezaure je základným pomocníkom pri formulácii rešeršnej stratégie a tým aj pri príprave informačných podkladov zakladaných a riešených výskumných úloh a projektov. Poskytuje potrebné informácie pre usmernenie postupu formulácie problému, napríklad pre kooperujúcich riešiteľov na výskumných úlohách a projektoch, odborníkov z oblastí mimo celulózo – papierenskej problematiky. V poslednom období sa práve toto hľadisko využívania tezauru stáva zaujímavým pre nové trendy vo výskume spojené s vyhľadávaním netradičných postupov spracovania drevnej hmoty a získavanie nových produktov.
Vyznačené paradigmatické vzťahy v rámci dohodnutej hierarchickej štruktúry zjednodušujú vyhľadávanie informácií, prípadne formuláciu informačnej požiadavky pri vypracovávaní rešerše. Spolu s priloženým manuálom a s popisom postupu využívania, sa riadený slovník tezaurus stáva aj pomocným nástrojom vzdelávania mladých pracovníkov, ktorí sa s problematikou oboznamujú. Riadený slovník – tezaurus- je vhodným podkladom pre zostavu výkladového slovníka odborných termínov v danom vednom odbore, ktorý v súčasnosti pre celulózo-papierenskú problematiku nie je k dispozícii.
Finálny informačný materiál – tezaurus - bude dostupný spolu s manuálom v printovej verzii a v rámci OpenAccess prístupu k informáciám sa predpokladá jeho sprístupnenie aj prostredníctvom stránky VÚPC (www.vupc.sk)