Tekstille saadaan uusi elämä, kun se digitoidaan ja käsitellään OCR-ohjelmalla. Paperioriginaali skannataan ensin sähköiseen muotoon. Optinen tekstintunnistusohjelma (OCR, Optical Character Recognition) tekee siitä tekstitiedoston. Tämän jälkeen tekstiä voi vapaasti muokata ja korjata.
Digitoiminen sopii painetulle, tulostetulle ja konekirjoitetulle tekstille. Saat vanhat kirjat, tutkimukset, käsikirjoitukset helposti muokattaviksi ja uudelleen käyttöön. Digitoiminen on halvempaa ja nopeampaa kuin uudelleen kirjoittaminen. Kirjantekijöille ja kustantajille OCR antaa mahdollisuuden tehdä vanhasta materiaalista helposti uusi painos.
Digitoiminen liittyy myös verkkojulkaisemiseen. Arkistojen aarteet voidaan julkaista ja levittää laajaan käyttöön. Esimerkiksi verkossa ilmestyvän lehden vanhatkin numerot kannattaa nyt skannata digitaaliseen muotoon ja laittaa verkkoon. Syntyy ehyempi ja laajempi digitaalinen julkaisuarkisto. Verkkokurssien suunnittelijat ja opettajat ovat digitoimalla saaneet tekstit sujuvasti verkkoon.
Yliopistopainolla on kokemusta digitoimisesta vuodesta 2002 lähtien ja tehokas OCR-tuotantojärjestelmä. Olemme toteuttaneet kirjoja näkövammaisille digitoimalla painettuja kirjoja. Myös Helsingin yliopiston opiskelijakirjasto on tehnyt sähkökirjoja kurssikirjoista, joiden painos on loppu tai joita ei löydy kirjastosta.
Eduskunnan valtiopäivien avajaispuheet koottiin 100-vuotisjuhlien kunniaksi yhteen kirjaksi digitoimalla A4-liuskoina ollut teksti. Myös erilaisten lehtien vanhoja numeroita on digitoitu niiden tekstien saamiseksi tietokantaan haettavaan muotoon.