Uusimman lehden artikkelit löydät täältä ja samat artikkelit löytyvät myös lehden etusivulta. Arkiston alta löytyvät myöskin kaikkien aiemmin julkaistujen asiakaslehtien artikkelit.

Informaatiotutkimus siirtyi verkkoon

Informaatiotutkimus siirtyi verkkoon

Vuodesta 1981 asti ilmestynyt Informaatiotutkimus-lehti muuttui kokonaan verkkojulkaisuksi vuoden 2008 alusta. Verkkolehteen haluttiin mukaan myös vanha ainoastaan paperilla oleva aineisto. Lehtiprojekti esiteltiin TSV:n ja Suomen tiedekustantajien Painetun aineiston uudelleen julkaiseminen verkossa -seminaarissa Tieteiden talolla 17.3.

Informaatiotutkimus (vuoteen 1995 Kirjastotiede ja informatiikka) on Informaatiotutkimuksen yhdistyksen kustantama tieteellinen aikakausjulkaisu ja on alan ainoa suomalainen vertaistarkastettu tieteellinen aikakausjulkaisu. Vuosina 2002–2007 lehti ilmestyi verkossa painetun rinnakkaisversiona Kansalliskirjaston ja Kopioston ylläpitämässä Elektra -julkaisuarkistossa. Uudeksi julkaisualustaksi valittiin vapaan lähdekoodin Open Journal Systems -järjestelmä.

Projektin tavoite oli saada myös aiemmin julkaistut lehdet PDF-tiedostoiksi sekä rakenteisiksi XML-tiedostoiksi, joita olisi myöhemmin helppo jatkojalostaa eri julkaisukanaviin. Viimeisimpien lehtien aineistot olivat jo PDF-muodossa, mutta vanhemmista 1981–2002 -vuosikerroista olivat tallella ainoastaan yhdet painetut arkistokappaleet. Tarjouskilpailun jälkeen lehtien digitoijaksi valittiin Yliopistopaino.

Digitoitava aineisto oli osittain nidottuina kirjoina sekä lehtinä. Koska julkaisuista ei ollut ylimääräisiä kopioita, niitä ei voitu leikata irtosivuiksi, mikä olisi nopeuttanut sivujen skannaamista huomattavasti. Sivut digitoitiin käsin skannerin lasilta, minkä jälkeen niille tehtiin tekstintunnistus. Lopulta aineisto tallennettiin sekä paino- että verkkokelpoisiksi PDF-tiedostoiksi ja tekstitiedostoiksi.

Kokonaan Informaatiotutkimuksen taru paperilla ei ole päättynyt, sillä osa verkkolehden rahoituksesta tulee painettavasta vuosikirjasta.

- Tulee huomattavasti edullisemmaksi tehdä kirjoja kuin lehtiä, projektia esitellyt päätoimittaja Kai Halttunen nauroi.

Informaatiotutkimus-lehti löytyy verkosta.

Tekstintunnistus luonteva jatko digipainamiselle

Tekstintunnistus tarkoittaa skannatun kuvamuodossa olevan sivun tekstien muuttamista merkeiksi muokattavaan ja editoitavaan muotoon. Tekstintunnistuksesta käytetään myös nimitystä OCR (Optical Character Recognition). Vaihtoehto tekstintunnistukselle olisi latoa tekstit käsin.

Yliopistopainoon tekstintunnistuspalvelut perustuvat vuosien saatossa kertyneelle digipainamisen osaamiselle. Ensimmäiset digipainokoneet tulivat Yliopistopainoon jo 80-luvulla. Seuraavalla vuosikymmenellä työnkulku muuttui digitaaliseksi siten, että sivun originaalit toimitettiin painoon valmiiksi tulostettuina sivuina, jotka sitten skannattiin ja painettiin. Ennen painamista sivuille tehtiin tarvittavat kuvankäsittelytoimenpiteet, kuten suoristus, läpinäkyvyyden poisto, kontrastin säätö yms. Samaa osaamista tarvitaan digitointiprojekteissa.

Yliopistopaino on tehnyt tekstintunnistusta jo vuodesta 2002. Tulevaisuuden kehityshankkeet keskittyvät tunnistuksen automaation lisäämiseen ja kustannustehokkuuteen, sekä tunnistetun tekstin muokkaamiseen XML-muotoon.

Viimeksi päivitetty 24.03.2009 14:35