Il tool software OCR per convertire a mano digitalizzata, documenti di testo dattiloscritto o stampato


E 'un sistema per i manoscritti file/print immagine digitalizzata conversione sulla vostra macchina testo leggibile. Sistemi OCR richiedono la calibrazione per leggere un carattere specifico; prime versioni devono essere programmati con le immagini di ogni personaggio, e ha lavorato su un carattere per carattere. Sistemi "intelligenti" con un elevato grado di precisione di riconoscimento della maggior parte delle fonti sono ormai all'ordine del giorno. Alcuni sistemi sono in grado di riprodurre un output formattato che è molto vicino alla pagina originale digitalizzata tra cui immagini, colonne e altri elementi non testuali.

Software OCR funziona analizzando un documento e confrontando font memorizzati nel suo database e/o rilevazione di caratteristiche caratteri. Alcuni software OCR messo anche attraverso un correttore ortografico per "indovinare" parole non riconosciute. Strumenti di OCR vengono con i loro limiti. È possibile eseguire la scansione di una pagina ha molto a che fare con la risoluzione, il contrasto e la nitidezza dei caratteri. Dal punto di vista di un utente medio, 100% di precisione è difficile da realizzare, ma approccio è quello che cerchiamo per più programmi.

Affronteremo due software OCR. Microsoft OneNote, incurante e probabilmente installato sul vostro sistema e FreeOCR, il software utilizza Tesseract-che è considerato uno dei motori OCR software libero più accurato attualmente disponibili.

Microsoft OneNote

Microsoft OneNote

Per basi casuali funzione OCR per Microsoft OneNote è un risparmio di tempo. Potreste aver perso, si chiama "Copiare testo dall'immagine".




Trascina una foto dal digitalizzata o salvato in Microsoft OneNote. È inoltre possibile utilizzare OneNote per ritagliare una parte dello schermo o l'immagine in Microsoft OneNote.

Clicca l'immagine inserita e selezionare "Copia testo immagine". Il testo deve essere copiato negli appunti otticamente riconosciuto e può essere incollato in qualsiasi programma come Microsoft Word o Notepad.

OneNote è la semplicità. Ma non è troppo grande per i caratteri scritti a mano o anche quelli sfocata. Ma per un lavoro rapido, sono tutti per la clip e incolla per Microsoft OneNote.

FreeOCR

FreeOCR

Questo software gratuito utilizza tesseract-ocr OCR, il motore OCR che è stato sviluppato presso gli HP Labs tra il 1985 e il 1995 ... e ora in Google. Il motore Tesseract OCR è stato uno dei primi motori 3-1995 prova UNLV precisione. Tra il 1995 e il 2006 c'era poco lavoro fatto su di esso, ma è probabilmente una delle più accurate open source motori OCR disponibili. Il codice sorgente leggerà un binario, immagine grigio o di colore e testo di output. Un lettore tiff è costruito in grado di leggere le immagini TIFF non compresso o libtiff possono essere aggiunti a leggere le immagini compresse.

FreeOCR è una semplice interfaccia di Windows per il codice sottostante. Supporta la maggior parte dei file di immagine e file TIFF da più pagine. Può gestire PDF e supporta anche dispositivi TWAIN come scanner. FreeOCR ha anche doppia interfaccia finestra familiarità con facile da capire le impostazioni. Prima di avviare il processo di conversione di un clic, è possibile regolare il contrasto dell'immagine per una migliore leggibilità.

FreeOCR è una scansione completa e programma OCR incluso di Windows compilati motore Tesseract OCR gratuito. FreeOCR è piccolo, semplice e facile da usare, e include un installer per Windows e supporta fax documenti TIFF multipagina, così come la maggior parte dei tipi di immagine come TIFF compresso che il motore Tesseract da sola non può lettura. Scansione TWAIN inclusa e il supporto per i documenti TIFF multipagina. Migliore di tutti, è completamente gratuito!

FreeOCR è stato completamente riscritto per Microsoft .NET Framework 2.0, soprattutto a causa dei problemi con la visualizzazione del testo Unicode correttamente la maggior parte degli ambienti di sviluppo più grandi purtroppo non supportano. Unicode è importante come il motore OCR supporta più lingue e li emette in UTF-8.

Requisiti:

  • Pentium - 200 MHz
  • 256 MB di memoria (RAM)
  • 10 MB di spazio libero su disco
  • Risoluzione schermo SVGA
  • Net Framework 2.0 o superiore

(0)
(0)

Commenti - 0

Non ci sono commenti

Aggiungi un commento

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caratteri rimanenti: 3000
captcha