Cum se convertesc documente scanate în Word - Android fericit

Dacă trebuie să digitalizați o carte în format text, este posibil să aveți mai multe întrebări. Ce se poate face? Ce zici de calitate, este bună? Nu numai că se poate face, dar există și mai multe moduri de a converti un document scanat în Word. Sa vedem:

  • Scanând documentul în format PDF și editându-l ulterior cu Adobe Acrobat XI Pro pentru a-l salva în format Word. Versiunea Pro a Acrobat este plătită, dar puteți achiziționa o licență de încercare gratuită de 30 de zile.
  • De pe site-ul OnlineOCR.net . Această aplicație web vă permite să convertiți documente în format PDF, JPG, TIFF și GIF în Word, Excel și text. În versiunea gratuită putem converti până la 15 pagini pe oră și documente de cel mult o pagină.
  • Scanând documentul în format (OCR) și salvându-l ca text. Apoi, putem deschide Word și îl putem edita sau salva în format .doc.
  • Folosind un program de recunoaștere optică a caracterelor :
    •  VueScan (disponibil pentru Windows, Mac OS X și Linux)
    • Kooka  (pentru Linux)
    • Office Lens (pentru Android și iOS )
    • CamScanner (pentru Android și iOS )

Cel mai eficient mod dintre toate pe care le-am putea spune este prin Adobe Acrobat Pro, dar numai dacă scanarea este foarte, foarte curată și de înaltă calitate. Aplicațiile optice de recunoaștere a caracterelor au parcurs un drum lung, dar arată totuși unele lacune cu lucruri precum bold sau cursiv, iar transcrierea unor cuvinte în funcție de tipul de font al documentului original poate fi greșită.

Încercați să scanați și să transmiteți acest document către Word pentru a vedea ce se întâmplă

De la scanerul în sine

Unele scanere includ funcția de recunoaștere optică (OCR) în propriul lor program de scanare. Pentru a scana un document în text trebuie doar să setați formatul de digitalizare și să priviți unul care se referă la OCR sau similar (depinde de marca / modelul scanerului).

Treceți de la PDF la Word cu Adobe Acrobat XI Pro

Odată ce Adobe Acrobat XI Pro este descărcat și instalat ( AICI aveți o versiune de încercare gratuită de 30 de zile) accesați „ Instrumente -> Recunoaștere text -> În acest fișier ”.

În fereastra „ Recunoașteți textul ” , faceți clic pe „ Editați ” și alegeți limba textului, stilul de ieșire și rezoluția.

În cele din urmă, reveniți la „ Instrumente -> Editare conținut -> Editați text și imagini ” și modificați textul dacă trebuie să corectați orice cuvinte. Pentru a termina, faceți clic pe „ Fișier -> Salvare ca ” și salvați-l în format Word.

OnlineOCR

OnlineOCR este o aplicație web pentru a transfera imagini sau pdf-uri în Word și este foarte ușor de utilizat. Vă explic cum funcționează: Introduceți //www.onlineocr.net/ și faceți clic pe „ Selectare fișier ”. Selectați documentul scanat, apoi alegeți limba și formatul de ieșire din cele 2 meniuri derulante pe care le aveți în centrul ecranului.

Pentru a termina, faceți clic pe „ Convertiți ”. Chiar sub aceasta va apărea o previzualizare cu text simplu pe care o puteți edita dacă trebuie să corectați orice cuvinte. În cele din urmă, faceți clic pe „ Descărcați fișierul de ieșire ” și puteți descărca fișierul în format Word. Iată un exemplu de PDF convertit în Word cu OnlineOCR:

  • PDF original:

  • Document convertit:

Dacă această aplicație web nu vă satisface, puteți încerca alte alternative similare, cum ar fi FreeOCR sau Free-Online-OCR .

Programe de recunoaștere optică a caracterelor (OCR)

Dacă nu doriți să vă modificați documentele online și aveți nevoie de o aplicație desktop, puteți utiliza aplicații precum VueScan (care este disponibil și pentru Mac și Linux în plus față de Windows-ul omniprezent).

O altă posibilitate este de a utiliza dispozitivul Android sau iOS pentru a scana documentul și a-l converti direct în text. Există aplicații precum Office Lens (pentru Android și iOS ) sau CamScanner (pentru Android și iOS ) care efectuează întregul proces din aceeași aplicație. În aceste cazuri, este recomandabil să curățați imaginea înainte de a o converti în text. Dacă doriți să aflați mai multe despre această metodă, aruncați o privire la ACEST POST .

În opinia mea, tehnica de recunoaștere optică a caracterelor, deși s-a îmbunătățit mult în ultimii ani, este încă la ani lumină de a fi o tehnică perfectă. Multe detalii, multe cuvinte pe care le „traduce” cu litere și simboluri incorecte care împrăștie textul. Îi lipsește încă acea inteligență suplimentară care îl face să vadă că „ t &! $ Olog1a ” nu poate fi o traducere validă a vreunui cuvânt dintr-un text. Încă nu văd o înțelegere a lecturii, ci o simplă recunoaștere vizuală a literelor individuale care formează cuvinte fără a le integra cu restul textului. Cu toate acestea, sunt convins că momentul în care vom face acest ultim mare salt se apropie în fiecare zi.

Aveți Telegram instalat? Primiți cea mai bună postare din fiecare zi pe canalul nostru . Sau, dacă preferați, aflați totul de pe pagina noastră de Facebook .