4 Nemokami internetiniai OCR įrankiai išbandyti

4 Nemokami internetiniai OCR įrankiai išbandyti

Jei norite bet kokį spausdintą tekstą paversti skaitmeniniu tekstu, kurį galite kopijuoti, įklijuoti, redaguoti ir ieškoti, turėsite naudoti optinio simbolių atpažinimo (OCR) skaitytuvus.





Kai nuspręsite nuskaityti ar fotografuoti dokumentą, jis bus išsaugotas tokiu formatu kaip JPEG arba PDF. OCR programinė įranga tada gali atpažinti šiuose dokumentuose esančias raides ir skaičius ir konvertuoti juos į PDF, kurio galima ieškoti, arba į failą, kurį galite redaguoti tokiose programose kaip „Microsoft Word“.





Problema ta, kad kai kurie OCR skaitytuvai veikia daug geriau nei kiti, o geriausias yra gana sunkus piniginėje.





Pavyzdžiui, „Omnipage18“ kainuoja 150 USD, tačiau ypač gerai atpažįsta skirtingas kalbas. „Adobe Acrobat Pro DC“ kainuoja akį traukiančius 400 USD, tačiau turi neįtikėtiną tikslumą. „ABBYY FineReader“ kainuoja 150 USD, tačiau puikiai paverčia dokumentus, tokius kaip žurnalai ir brošiūros, į tekstą, kurio galima ieškoti. Vėliau šiame straipsnyje išbandysime ABBYY internetinį pasiūlymą.

Tačiau, jei ieškote nemokamų alternatyvų, kurias galite parsisiųsti ir naudoti „Windows“ arba „OS X“, turėtumėte išbandyti šiuos OCR įrankius. Bet jei norėtumėte naudoti nemokamą, prisijungęs OCR įrankis, skaitykite toliau, nes išbandėme keletą geriausių, o rezultatai pateikiami žemiau.



Testas

Atrodo, kad dauguma žmonių dabar naudoja savo išmaniuosius telefonus, kad nuskaitytų juos, aš nusprendžiau naudoti „Evernote“ nuskaitoma programa (Nemokama „iOS“ ir „Android“). Nuskenavau pirmąjį Richardo Dawkino puslapį Neįmanoma įkopti į kalną , norėdami pamatyti, kokių rezultatų galėtume gauti su labai paprastu formatavimu. Aš taip pat nuskenavau Tim Ferriss puslapį 4 valandų virėjas išbandyti skaitytuvus su šiek tiek sudėtingesniu formatavimu. Kiekvieną iš šių failų išsaugojau kaip PDF.

Tuomet šie dokumentai buvo peržiūrimi naudojant kai kuriuos tariamai geriausius internetinius OCR įrankius, kad būtų galima pamatyti, kaip jiems sekėsi.





Nemokamas internetinis OCR [nebėra galimybės]

Laimei, norint naudotis nemokamu internetiniu OCR nereikia registruotis. Ir aš buvau dvigubai sužavėtas, kai pamačiau jų reikalavimą išlaikyti mano dokumento formatavimą ir maketą.

Svetainė teigia galinti palaikyti PDF, GIF, BMP, JPEG, TIFF ir PNG formatus. Išvestys gali būti DOC, PDF tekstinis dokumentas, RTF ir TXT. Deja, negalėjau sužinoti, ar jie turi failo dydžio apribojimą.





Pagrindinis dokumentas į PDF

Visiškai puikiai konvertuotas. Nėra daug ką pasakyti! Mes einame į a labai gera pradžia.

Pagrindinis dokumentas į DOC

Atrodo, kad tikrieji žodžiai buvo nepriekaištingai paversti, išskyrus „ountą“ iš „Rushmore kalno“, kažkaip einantį AWOL. Tačiau formatavimas yra kita istorija. Daugelis kablelių buvo pakeisti apatiniais brūkšniais, o dokumento taškuose buvo įterpti atsitiktiniai tarpai. Kai vėliau pamatysite, kaip aukščiausios kokybės programinei įrangai sekėsi šiame bandyme, tai nėra bloga pastanga iš viso .

Sudėtingas dokumentas į PDF

Sudėtingas dokumentas į DOC

Šį kartą konversija truko tik 10 sekundžių, o tekstas vėl buvo konvertuotas maždaug 95% tikslumu. Kilo keistų tarpų problemų, o programinei įrangai kilo problemų konvertuojant šriftą dokumento viršuje dešinėje, ir čia ir ten praleido keletą simbolių.

Verdiktas

i2OCR

„i2OCR“ pateikia keletą įspūdingų teiginių. Įrankis atpažįsta daugiau nei 60 kalbų, gali tvarkyti kelių stulpelių maketus (pašalindamas formatavimą), neturi failo dydžio apribojimų, gali konvertuoti įkeltus failus ir iš URL. Norėdami naudotis šiuo įrankiu, jums taip pat nereikia registruotis.

Paslauga veikia tiesiog ištraukiant tekstą iš jūsų vaizdo, tada išvedant neformatuotą tekstą. Prieš nukopijuodami tekstą į kitas programas arba atsisiųsdami kaip DOC, PDF arba HTML, galite greitai ištaisyti visas klaidas, esančias greta esančiame vaizde.

Pastaba: kai bandžiau įkelti savo PDF dokumentus, „i2OCR“ juos atmetė, todėl turėjau juos konvertuoti į JPEG (padarius jų ekrano kopiją, tada įkeliant failus).

Pagrindinis dokumentas į paprastą tekstą

Sudėtingas dokumentas į paprastą tekstą

Didžioji teksto dalis buvo paversta be daug klaidų, išskyrus pavadinimą ir receptą viršuje dešinėje, kuris šiam įrankiui buvo neįskaitomas. Stulpelių konvertavimo į paprastą tekstą būdas toli gražu nebuvo idealus. Jei norite, kad ši konversija būtų veiksminga, eilučių pertvarkymui į nuoseklius sakinius prireiktų daug laiko.

Verdiktas

Internetinis OCR

Internetinis OCR šiuo metu palaiko 46 skirtingas kalbas ir gali konvertuoti PDF, JPG, BMP, TIFF ir GIF į „Word“, „Excel“ ar paprasto teksto formatą. Svetainėje teigiama, kad „konvertuoti dokumentai atrodo lygiai taip pat, kaip ir originalas - lentelės, stulpeliai ir grafika“.

Versija, kurią galite naudoti be registracijos, leidžia konvertuoti iki 15 vaizdų per valandą (5 MB riba). Jei prisiregistruosite gauti paskyrą, galėsite įsigyti daugiau puslapių, viršydami šią ribą, taip pat galėsite konvertuoti kelių puslapių dokumentus ir ZIP archyvus.

Pagrindinis dokumentas į DOC

Pagrindinis dokumentas nepriekaištingai paverstas, išskyrus romėnišką skaičių nėra paimamas. Kaip žadėjo svetainė, formatavimas buvo toks, koks buvo knygoje. Pagarba šiam įrankiui.

Sudėtingas dokumentas į DOC

Nusivylęs ankstesniais OCR įrankiais konvertuojant sudėtingą dokumentą, mane labai sužavėjo internetinis OCR. Išdėstymas buvo beveik tobulas, kaip matote aukščiau. Tačiau dar kartą, receptas nebuvo perrinktas per gerai, tačiau visos kitos smulkios klaidos buvo nereikšmingos.

Verdiktas

Visiškai fantastiški internetinio OCR rezultatai. Vienintelis trūkumas, kurį matau, yra tai, kad nėra galimybės atsisiųsti konvertuotų dokumentų PDF formatu, nes minėti išvesties formatai apima tik DOCX, XLSX ir TXT.

„ABBYY FineReader Online“ (10 puslapių bandomoji versija)

Kaip minėta anksčiau, ABBYY yra viena iš OCR programinės įrangos rinkos lyderių, kainuojanti apie 150 USD už visą atsisiunčiamą programą. Jie siūlo A. 10 puslapių nemokama bandomoji versija savo internetiniam įrankiui (būtina registracija). Už 5 USD prenumeratą jų internetinis įrankis leis jums kiekvieną mėnesį konvertuoti 200 puslapių.

Priimami failai gali būti iki 100 MB bet kuriuo iš šių formatų: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ir PNG. ABBYY taip pat atpažįsta beveik 200 kalbų. Išvestys yra ypač įspūdingos, galima rinktis iš DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ir EPUB.

Bandymo metu netgi galite išbandyti keletą BETA funkcijų. Pirmasis yra galimybė išversti dokumentą į kitą kalbą. Kitas yra eksportuoti konvertuotą dokumentą į debesies saugyklos paskyrą, nesvarbu, ar tai būtų „Dropbox“, „Google“ diskas, „Evernote“, „Microsoft OneDrive“ ar „Box“.

Pagrindinis dokumentas į DOCX

Sudėtingas dokumentas į DOCX

Konvertavus dokumentą, tekste buvo labai nedaug klaidų (išskyrus OCR, vėl kovojantį su šio recepto šriftu!), Tačiau formatavimas paliko daug norimų rezultatų.

Trys stulpeliai kažkaip užėmė du puslapius, su centrine skiltimi tik pasirodo antrame puslapyje. Jei iš tikrųjų norėtum daryti bet ką su šiuo konvertuotu dokumentu galų gale ištrauktumėte plaukus.

Pagrindinis dokumentas į PDF

Sudėtingas dokumentas į PDF

Verdiktas

Galutinis rezultatas

Jei, kaip ir dauguma žmonių, jūs tik norite nuskaityti kelis žurnalų straipsnius ir kai kurias buitines sąskaitas, jums nereikės redaguoti šių dokumentų. Todėl tiesioginis konvertavimas į PDF bus jums tinkamas, nes jūs vis tiek galėsite ieškoti tų dokumentų. Šiuo tikslu nemokamas internetinis OCR tikrai buvo geriausias nemokamas įrankis, kurį išbandėme. Tai sakant, jei esate pasirengęs mokėti 5 USD per mėnesį už beveik tobulumą, „ABBYY FineReader Online“ buvo šiek tiek tikslesnis.

Kalbant apie dokumentų konvertavimą į DOC, mums nepavyko rasti tobulo sprendimo, tačiau iki šiol geriausi rezultatai buvo gauti Internetinis OCR . Konvertavimas nebuvo tobulas, tačiau formatavimo vientisumas iš esmės išliko nepakitęs, o klaidų buvo nereikšminga. Palyginę šiuos rezultatus su „premium“ pasiūlymu iš „ABBYY“, jūs galite būti neįtikėtinai sužavėti.

Į šį įrašą neįtraukėme „Google“ disko OCR galimybių; šiek tiek dėl „Google“ visapusiškumo, bet labiau už tai, kad norėjome išbandyti keletą kitų nemokamų internetinių OCR paslaugų.

Jums: kokius kitus internetinius OCR įrankius rekomenduotumėte mūsų skaitytojams? Ir ką jūs bandėte, kad daugiau niekada nenaudotumėte?

Dalintis Dalintis „Tweet“ Paštu Kalbos animacijos vadovas pradedantiesiems

Kalbos animacija gali būti iššūkis. Jei būsite pasirengę pradėti dialogą prie savo projekto, mes suskaidysime procesą už jus.

„iPhone“ įstrigo ant „Apple“ logotipo „iPhone 11“
Skaityti toliau Susijusios temos
  • internetas
  • Produktyvumas
  • Failo konvertavimas
  • OCR
Apie autorių Robas Lakštingala(Paskelbti 272 straipsniai)

Robas Nightingale'as yra baigęs filosofijos studijas Jorko universitete, JK. Jis daugiau nei penkerius metus dirbo socialinės žiniasklaidos vadybininku ir konsultantu, vesdamas seminarus keliose šalyse. Pastaruosius dvejus metus Robas taip pat buvo technologijų rašytojas, „MakeUseOf“ socialinės žiniasklaidos vadovas ir naujienlaiškių redaktorius. Paprastai jį rasite keliaudamas po pasaulį, mokydamasis redaguoti vaizdo įrašus ir eksperimentuoti su fotografija.

Daugiau iš Rob Nightingale

Prenumeruokite mūsų naujienlaiškį

Prisijunkite prie mūsų naujienlaiškio, kad gautumėte techninių patarimų, apžvalgų, nemokamų el. Knygų ir išskirtinių pasiūlymų!

Norėdami užsiprenumeruoti, spustelėkite čia