OCR

Mac OS X e le sue Applicazioni

Moderatore: ModiMaccanici

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

Avrei bisogno di un consiglio, senza aprire flame su quello che è meglio o peggio,
a proposito di un buon OCR per macOS. Preciso che mi capita di dover effettuare il riconoscimento
non solo su pdf, ma anche su testi copiati come immagini .jpeg e, più di rado, .tiff.
Su Linux uso tesseract, che però si può adoperare solo da console (il che non mi pone grosse difficoltà).
Mi interessa soprattutto la qualità del risultato. Ho cercato con Google, ma ovviamente
ci sono decine e decine di recensioni ed è arduo orientarsi
Grazie
M

Avatar utente
Cindy
Stato: Non connesso
Expert
Expert
Avatar utente
Iscritto il: mer, 12 mag 2021 17:14
Messaggi: 1221

Top

Se hai aggiornato/ stai per aggiornare a Monterey trovi già tutto nel tuo MAC. È una delle nuove funzioni del nuovo SO.
Di questa e delle altre nuove funzioni ne stiamo parlando proprio qui (anche pagina successiva): viewtopic.php?f=76&t=50001&start=30

Vedi se ti aiuta! :wink:
Immagine

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

aggiornato, ma in quella discsussione leggo:
Se vuoi il testo di un'immagine devi usare la funzione ocr di programmi per pdf. Acrobat lo fa abbastanza bene
m

Curzio
Stato: Non connesso
Type Expert
Type Expert
Iscritto il: gio, 09 lug 2009 13:15
Messaggi: 2182

Top

samiel ha scritto:
mer, 27 ott 2021 19:05
Avrei bisogno di un consiglio, senza aprire flame su quello che è meglio o peggio,
a proposito di un buon OCR per macOS. Preciso che mi capita di dover effettuare il riconoscimento
non solo su pdf, ma anche su testi copiati come immagini .jpeg e, più di rado, .tiff.
Su Linux uso tesseract, che però si può adoperare solo da console (il che non mi pone grosse difficoltà).
Mi interessa soprattutto la qualità del risultato. Ho cercato con Google, ma ovviamente
ci sono decine e decine di recensioni ed è arduo orientarsi
Grazie
M
Io uso con grande soddisfazione un sw classico, abbyy finereader ma non l’ho testato granché su immagini

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

@curzio
Dalla pagina web di quell'app vedo che la versione per mac è parecchio limitata
rispetto a quella per Windows, e cmq costa abbastanza :(

vedo cmq che si può utilizzare anche tesseract:
https://guides.library.illinois.edu/c.p ... &p=4121425
che tuttavia non riesce a riprodurre anche la formattazione del testo
(salva solo in .txt)

Avatar utente
J.T.Kirk
Stato: Non connesso
Expert
Expert
Avatar utente
Iscritto il: sab, 07 nov 2015 12:00
Messaggi: 6473

Top

In quella discussione si parla del nuovo sistema Monterey che permette di selezionare il testo delle immagini ma non è perfetto al 100%, sembra.
Se non hai Monterey puoi usare un software con ocr.

Con Acrobat ho reso selezionabili delle riviste scansionate come immagini e il risultato era soddisfacente.
.
Messaggio nascosto. Agitare la bacchetta e pronunciare "Aparecium"

"Non auro, sed ferro, recuperanda est patria" - Marco Furio Camillo

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

Io chiedevo esattamente a proposito di un buon OCR
Cmq ho appena aggiornato a Monterey: l'ora è tarda, domani faccio un po' di esperimenti.
Poi, gli escamotage possono essere molti: alla disperata, stampo il pdf, lo scansiono come .jpeg o .tiff
e ci faccio l'ocr. certo, potendo evitarlo...

m

Avatar utente
fragrua
Stato: Non connesso
Admin of my life
Admin of my life
Avatar utente
Iscritto il: sab, 08 ott 2005 07:00
Messaggi: 63717
Località: [k]ragnano

Top

Contatta:
samiel ha scritto:
gio, 28 ott 2021 01:42
stampo il pdf, lo scansiono come .jpeg o .tiff
e ci faccio l'ocr. certo, potendo evitarlo...
Stampare?
E perché mai. Apri il PDF con anteprima e lo esporti come .jpeg o .tiff
La prima cosa su cui devi investire è il benessere del tuo corpo, l'unica cosa che ti porterai nella tomba.
Franz Grua (sarebbe fragrua)

In un mondo perfetto io sarei un essere inutile.
©2015 albertocchio

—> Uso corretto del Forum: https://goo.gl/9xOO0a

Immagine

Avatar utente
fragrua
Stato: Non connesso
Admin of my life
Admin of my life
Avatar utente
Iscritto il: sab, 08 ott 2005 07:00
Messaggi: 63717
Località: [k]ragnano

Top

Contatta:
Ho fatto l'OCR da uno screenshot con Anteprima di Monterey. Risultato ottimo.

Immagine

Addirittura direttamente dalle immagini dei risultati di ricerca di Safari!

Immagine
La prima cosa su cui devi investire è il benessere del tuo corpo, l'unica cosa che ti porterai nella tomba.
Franz Grua (sarebbe fragrua)

In un mondo perfetto io sarei un essere inutile.
©2015 albertocchio

—> Uso corretto del Forum: https://goo.gl/9xOO0a

Immagine

Avatar utente
RickS
Stato: Non connesso
Expert
Expert
Avatar utente
Iscritto il: dom, 04 mag 2008 19:42
Messaggi: 1313

Top

samiel ha scritto:
mer, 27 ott 2021 23:59
@curzio
Dalla pagina web di quell'app vedo che la versione per mac è parecchio limitata
rispetto a quella per Windows, e cmq costa abbastanza :(

vedo cmq che si può utilizzare anche tesseract:
https://guides.library.illinois.edu/c.p ... &p=4121425
che tuttavia non riesce a riprodurre anche la formattazione del testo
(salva solo in .txt)
Io uso ABBYY FineReader PDF for Mac https://pdf.abbyy.com/it/finereader-pdf-for-mac/ da diversi anni, l'ultima versione la 15 finalmente copre molti dei diversi gap che aveva con quella Windows, non tutti ma molti.
È vero che non costa poco, ma si può scaricare la demo per provarla.
Io la uso principalmente per trasformare file jpeg in documenti Word, e ormai sempre più raramente PDF non editabili, cioè PDF che contengono solo file jpeg di pagine con testo e imagini, in PDF con testo ricercabile, cioè il testo in caratteri editabile e ricercabile viene messo in un layer sotto all'immagine.
Quello che ancora a volte non funziona bene o non funziona affatto è trasformare direttamente un file tiff o jpeg in un file PDF dove viene preservato il layout del file tiff, la posizione delle immagini, e il testo viene convertito totalmente in caratteri preservandone la formattazione.
Tutto sommato devo dire che funziona bene, anche se rispetto ad anni fa la uso molto di meno.
*******************************
Vendo MacBook pro 15 Touch 2016 - 2,9 GHz Quad-Core Intel Core i7
Radeon Pro 460 4 GB Ram 16 GB SSD 1TB
Educazione, comprensione e pazienza sono i presupposti di comunicazione riuscita
Mai confondere l'educazione con la debolezza
In caso di emergenza chiamatemi digitando sul mio avatar il numero 555-610610

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

Ho fatto qualche esperimento. Con alcuni .jpeg seleziono e incollo il testo.
Con altri invece, ad es mi fa selezionare il titolo, ma poi non il testo dell'articolo.
Il cursore (che assume forma di crocetta) mi consente solo
di inquadrare il testo (con un "rettangolo" con dei pallini
azzurri ai vertici) e non capisco la difformità di questo comportamento.
Inoltre, se devo fare questa operazione con un testo a più colonne,
non riesco a selezionare una colonna sola alla volta. Voglio troppo?

m

Avatar utente
Cindy
Stato: Non connesso
Expert
Expert
Avatar utente
Iscritto il: mer, 12 mag 2021 17:14
Messaggi: 1221

Top

Con un testo su più colonne faccio: screenshot della prima colonna - evidenzia - copio incollo; screenshot della seconda colonna - evidenzia - copia incolla…
Immagine

samiel
Stato: Non connesso
Maccanico assiduo
Maccanico assiduo
Iscritto il: dom, 09 set 2018 00:48
Messaggi: 142

Top

d'accordo, con più colonne serve lavoro supplementare.
ma perché certe immagini riesco a selezionarle come testo (cursore verticale)
e di conseguenza a fare il copia/incolla, mentre certe altre no?
o al massimo mi seleziona i titoli e il testo no?

Rispondi

Torna a “Software”

Chi c’è in linea

Visitano il forum: Nessuno e 5 ospiti