Mitä jos saisit skannatut tiedostot suoraan koneellesi tekstimuotoon niin, että voit tarvittaessa muokata tekstiä? Tai jos skannaukset menisivät automaation ja tekstisisällöntunnistuksen avulla suoraan oikeisiin pilvikansioihin? Entäpä, jos pilvikansioon tallennetulle skannaustiedostolle tulisi automaattisesti tiedostonimeksi sama nimi, joka löytyy skannatun sisällön otsikosta? Tässä blogissa puhutaan tekstintunnistuksesta skannauksessa. Tervetuloa nykypäivään!
Monissa konttoreissa tai kotitoimistoissa monitoimilaitteen tai pöytäprintterin päällä nököttävän skannerin käyttö on perinteisimmillään sitä, että skannatusta dokumentista muodostunut kuvatiedosto lähetetään itselle sähköpostiin tai verkkolevyn tiettyyn kansioon pitkän listan jatkoksi. Moniin käyttötarpeisiin jo pelkästään tämä on saattanut riittää, mutta tällöin kuitenkin skannattu teksti, esimerkiksi sopimus, lomake tai mikä tahansa muu tekstisisältöinen asiakirja päätyy yleensä muotoon, josta tekstin muokkaaminen tai tietojen koostaminen eteenpäin ei enää sitten onnistukaan - ainakaan helposti.
Eräs ehkä vähemmälle huomiolle jäänyt, mutta jopa merkittävissä määrin skannattujen tietojen käsittelyä helpottava käyttötapa on, että sopivan tekstintunnistusohjelmiston (OCR, Optical character recognition) avulla skannerin ottamasta kuvasta voidaan tunnistaa kirjainten hahmot ja muuttaa skannaus kuvan sijasta suoraan tekstiksi. Tekstintunnistuksella saadaankin skannauksesta ns. sisältö irrotettua helpommin muokattavaan muotoon. Tällöin skannattuja dokumentteja pystytään viemään tekstinkäsittelyohjelmaan muokattavaksi tai voidaan vaikka automatisoida skannattujen asiakirjojen tallennusta.
Tunnistuksessa voi kuitenkin tapahtua virheitä, koska skannattavat dokumentit luetaan optisesti ja tulkitaan laitteelle ohjelmoitujen mallien mukaisesti. Lopputulokseen vaikuttavat:
Kuten monessa muussakin asiassa tietotekniikan saralla, niin tässäkin tulee ennemmin tai myöhemmin näkymään tekoälyohjelmistojen ja koneoppimisen kehitys. Laitteet tulevat oikolukemaan tekstiä ja tekemään virheenkorjausta reaaliajassa, jolloin käyttäjä voi olla kohtuullisen luottavainen siihen, että tiedot tulevat skannauksesta tallennettuun tiedostoon oikein ja muuttumattomina.
Jos yrityksessänne on ajatuksissa saada tehostettua skannattujen dokumenttien tallentamista digitaaliseen muotoon, niin mitenkäs sitten toteutus? Maailmaan ja varsinkin internetiin mahtuu monenlaista ohjelmistoa alkaen ihan yksittäisten tekijöiden erikseen asennettavista ohjelmista tai sovelluksista, ja päätyen suurten ohjelmistojättien ohjelmistokokonaisuuksien yhteyteen integroituihin työkaluihin. Näissä haasteina saattaa olla ohjelmistojen vaatimat asennukset erikseen jokaiselle työasemalle, tai pahimmillaan riskeerataan jopa yrityksen tietoturvallisuus, jos käytössä on huolettomasti käyttöönotettu tuntemattoman tekijän sovellus.
Canonin monitoimilaitteiden ja skannereiden yhteyteen valinta on helpoimmillaan uniFLOW Online. Pilvipohjaisena ratkaisuna tämä sopii niin pienille kuin suurillekin yrityksille riippumatta laitteiden tai käyttäjien määrästä. UniFLOW Onlinen myötä on saatavissa käyttöön useita skannausvaihtoehtoja pilvitallennuksesta kehittyneempiin työnkulkuihin ja tekstintunnistukseen perustuviin toiminnallisuuksiin. Suuren ja tunnetun tekijän tuotteessa on huomioitu tietoturva, jatkuvat päivitykset ja tuettuna löytyy myös suomen kieli.
UniFLOW onlinen avulla voidaan automatisoida skannattujen asiakirjojen tallennusta esim. teidän yrityksenne omaan Sharepointin tiedostokirjastoon, OneDriveen tai johonkin muuhun tallennuspaikkaan. Skannauksien tiedostonimet voidaan automaattisesti nimetä dokumentin sisällön mukaan ja tarvittaessa poimia dokumenteista ennalta määritettyjä tietoja skannattujen dokumenttien kirjastointia ja järjestelyä varten. Ulkoasultaan erilaisten lomakkeiden skannausta varten voidaan UniFLOW Onlinessa luoda erillisiä skannausprofiileja, joilla mahdollistetaan esim. erilaisista lomakepohjista haluttujen tietokenttien tulkitseminen ja vähennetään virheellisiä tunnistuksia.
UniFLOW Onlinen kautta skannattujen dokumenttien tekstintunnistuksen oikeellisuuden ennen tiedoston siirtoa lopulliseen tallennuspaikkaan voi käyttäjä itse tarkistaa tai jos yrityksessänne halutaan kaikkien skannausten tarkistus meneväksi tietyn henkilön kautta niin palveluun voidaan määrittää skannattujen dokumenttien siirto toiselle käyttäjälle.
Ja tokihan UniFLOW Onlinen myötä on sitten mahdollisuus saada käyttöön myös laaja kattaus muita erilaisia työkaluja tulostuksenhallintaan.
UniFLOW Online ratkaisuun pääsee tutustumaan omatoimisesti osoitteessa: https://www.canon.fi/business/products/software/uniflow-online/
Voit myös olla yhteyksissä meihin, kerromme mielellämme aiheesta lisää. Katsotaan samalla millainen ratkaisu sopisi teidän ympäristöönne parhaiten!
Marskidatan Print Services -tiimin edustajana lämpimästi ja mielelläni lähden esittelemään ja vähän myös kehumaan uusinta Canon-perheen imageRUNNER DX -sarjaa. Edellisen blogini aiheena oli ”Back to the future”, nyt voisin käyttää ilmaisua ”Prepare for the future”.
Aikaisemmassa blogissani kirjoitin kopiokoneista ja niiden ominaisuuksista 10–20 vuotta sitten. Nyt ajat ovat muuttuneet siten, että monitoimilaitteelta vaaditaan hybridityöskentelyn ominaisuuksia tulostuksen ja digitaalisen työnkulun keskuksena. Monitoimilaitteen tulee olla myös paikka, jossa digitaalinen muoto muutetaan tulosteeksi ja vastaavasti tuloste digitaaliseksi. Laitteen täytyy myös olla saumattomasti yhteydessä työtilasovelluksiin niin, että asiakirjat siirtyvät helposti ja nopeasti erilaisiin työnkulkuihin… Savoksi sama, sukkelasti.
Tästä aasinsiltana päästiin asian ytimeen eli Canon imageRUNNER ADVANCE 3rd Generation -alustaan perustuviin asiakirjojen skannaus- ja käsittelytekniikoihin sekä integroituihin pilvipalveluihin. Hyvillä yhteyksillä varustetut, tehokkaat ja suojatut imageRUNNER ADVANCE DX -sarjan laitteet edistävät digitalisaatiota yhdistämällä fyysiset ja digitaaliset informaatiot toisiinsa. Jos minkä, niin tämän ansiosta, yrityksesi toimii mahdollisimman tuottavasti tulevaisuudessa.
Canon on imageRUNNER ADVANCE DX -sarjan myötä Canon on myös panostanut ympäristövaikutuksiin niin, että laitteet tuottavat jopa 18 prosenttia vähemmän hiilidioksidipäästöjä koko elinikänsä aikana. Canon on myös alentanut sarjan laitteiden virran kulutusta 15 prosenttia lepotila- ja väriaine/lämpötilamuutoksilla. Uudella teknologialla mahdollistetaan myös jätteiden määrän, energian kulutuksen ja materiaalin käytön minimointi. Tämä mahdollistuu esimerkiksi laitteen ohjelmistolla, joka poistaa tyhjät sivut sekä esikatselutoiminnolla, jonka ansiosta työt tulostuvat kerralla oikein. Näillä toimenpiteillä myös yrityksesi pääsee paremmin saavuttamaan kestävän kehityksen tavoitteet ja arvot.
Me Marskidatalla toteutamme myös vahvasti Canon-periaatteita laitteiden ympäristövaikutuksia ajatellen. Tätä toimintamallia tukee Marskidatan ympäristösertifikaatti ISO:14001. Kaikki meille palautuvat ikänsä lopussa olevat Canon-laitteet kierrätetään, samoin tietoturvapuoli hoidetaan täydellisellä laite-clearauksella ja kiintolevyn tuhoamisella.
Tämän lisäksi suojausominaisuuksia täydentää vielä myös käytön aikana ja sen jälkeen:
Siinä lyhykäisesti kiteytettynä uuden Canon imageRUNNER ADVANCE DX -sarjan hienouksia sekä meidän Marskidatan huoltopuolen ajatuksia laitteista. Lisäksi on vielä pakko mainita, että myös teknisesti toimivuus ja luotettavuus tässä DX-sarjassa on parantunut entisestään edeltäjiinsä verrattuna…
jos se on ylipäätään mahdollista…
…no kyllä se näköjään on.
Are you ready for the future, we are!
Nykypäivänä tulostaminen on paljon muutakin kuin pelkkä tuotettu tuloste. Siihen sisältyy myös GPDR:n myötä tulleet vaatimukset. GDPR tulee sanoista General Data Protection Regulation (yleinen tietosuoja-asetus). Se on henkilötietojen käsittelyä sääntelevä laki, jota alettiin soveltaa kaikissa EU-maissa keväällä 2018.Tietosuoja-asetus antaa paremman suojan henkilötiedoillesi ja enemmän keinoja hallita tietojesi käsittelyä. Voimme auttaa sinua Marskidatalla tarkentamaan yrityksenne todelliset tarpeet ja kehityskohteet GDPR.n tiimoilta.
Nykypäivänä moni voi olettaa, että mitkä tahansa tulostusprosessin tuloksena luodut tulosteet salataan, jotta ulkopuolinen taho ei pääse sieppaamaan sisältöä. Näin ei aina kuitenkaan ole. Tulostettujen tietojen suojaus kannattaa aina varmistaa esim. turvatulostuksella, kun tietoja siirretään, pidetään tulostusjonossa tai väliaikaisessa muistissa tai kun tulostustöitä säilytetään kiintolevyillä.
Tähän on ratkaisuna Canon-tuoteperheessä uniFLOW, jolla voidaan varmentaa käyttäjä ja vapauttaa tulosteet turvallisesti, ilman, että niihin pääsisi käsiksi jokin ulkopuolinen taho. Tulosteet voidaan määritellä poistettavaksi tietyn aikaikkunan jälkeen, tai jos käyttäjä unohtaa tulostaa, järjestelmä poistaa ne automaattisesti ajan täytyttyä. Palvelu käy pieniin tai suurempiin yrityksiin, ja se on saatavana palvelin- ja pilvipalveluohjelmistoratkaisuna. Turvatulostuksen avulla tulosteet voidaan tulostaa yrityksen mistä tahansa uniFLOWhun kytketystä laitteesta, riippumatta työpaikan sijainnista.
Skannaamisessa voimme myös hyödyntää pilvipalveluja. Skannaus voi tapahtua esimerkiksi pilveen haluttuun resurssiin. Asiakirjan salaaminen voidaan mahdollistaa myös skannauksen yhteydessä, jolloin käyttäjä, jolla on pääsy asiakirjaan, voi ottaa sen käsittelyyn sijainnistaan riippumatta. Tällä tehostetaan prosessin kulkua.
Uudemmista monitoimilaitteista löytyy myös itsestään sisäänrakennettuja ominaisuuksia, joilla voidaan salata skannattuja dokumentteja tai voidaan skannata ne muokattavaan tilaan Word- ja Powerpoint-tiedostomuotoa käyttäen. Käyttäjille voidaan luoda myös valmiita työnkulkuja, jotka säästävät aikaa muihin päivittäisiin työtehtäviin. Tästä käytetään nimeä älyskannaus. Näissä kaikissa toiminnoissa voimme hyödyntää kokonaisuutta, jossa on mukana palvelin- ja tulostusympäristö yhdistettynä operaattoripalveluihin.
Sähköinen arkistointi on nykypäivää. Tällöin asiakirjat arkistoidaan sähköisiin arkistosijainteihin, josta ne ovat helposti haettavissa tunnisteilla tai kohdennetuilla avainsanoilla. Näin saavutetaan hyvät tietoturvavaatimukset. Käyttöoikeuksia voidaan määritellä sen mukaan, mitä kullekin käyttäjälle sallitaan. Käyttäjä voi esimerkiksi vain lukea arkistoitua tietoa tai muokata sitä.
Lisäksi kaikesta toiminnasta jää jälki tai versio, jossa voidaan palata edelliseen asiakirjaversioon tarvittaessa. Esimerkkinä tilanne, että asiakirjassa huomataan virhe, joka halutaan korjata tai muuttaa. Lisäksi voidaan antaa pääsy asiakkaalle hänen omiin sähköisiin arkistoihin tai tietueisiin, joita käyttäjä pääsee tarvittaessa muokkaamaan ja tallentamaan etänä.
Yrityksen tulostusympäristöä voidaan hallita kustannuspohjaisesti. Raportteja saadaan eri muodoissa, joita tarkastelemalla pystytään siirtämään kapasiteettia sitä tarvitseville yksiköille. Tämän avulla saadaan käytettävistä skannaus- ja tulostusympäristöistä paras mahdollinen hyöty.
Yritys voi olla myös omalta osaltaan tukemassa ympäristöarvoja, esimerkiksi oikeanlaisella tulostuksen ja skannauksen työnkululla. Työnkulun ansiosta voidaan myös varmistua siitä, että käyttäjä todennetaan oikeaksi asiakirjan käsittelijäksi, kun työprosessissa tulostetaan tai skannataan.
Yleensä kaikkein turvallisempana laitteena pidetään sellaista, joka on kytketty verkosta irti ja sammutettuna, mutta silloin työtä ei voi välttämättä sataprosenttisesti tehdä. Siksi kaikkiin näihin kysymyksiin löytyy ratkaisut, joilla voidaan saada tieturvallinen hallinta ympäristöihin, joissa työskennellään ja tuotetaan asiakirjoja joko paperisena tai sähköisessä muodossa. Me Marskidatalla voimme tehdä tähän kaikkeen kokonaiskattavan kartoituksen, jossa tulee ilmi tietoturva- ja päivitystarpeet ympäristössänne. Näin saadaan säästöjä pidemmällä aikavälillä.
Kaikilla näillä työkaluilla autamme saavuttamaan parhaiden käytäntöjen mukaiset hyödyt yrityksen tulostusympäristön ylläpidossa ja kehittämisessä.
Turvallisen tulostamisen ja skannaamisen lisäksi, autamme sinua mm. näissä: