In materia di condivisione dei documenti, il formato migliore è di certo il PDF per la sua semplicità nella gestione sia a livello di immagini che di formattazione del testo. Tuttavia, indipendentemente dal fatto che per molti è un punto di forza per altri un punto di debolezza, i PDF lasciano un po’ a desiderare in termini di flessibilità. Un esempio aiuterà a rendere l’idea: supponi di voler fare il copia e incolla del testo di un file PDF su un file Word. A meno che non sia bloccato (in questo caso è impossibile, ma puoi sbloccarlo con appositi programmino), facendo “ctrl+c” e poi ““ctrl+v”, noterai come la formattazione ottenuta sul documento in Word non sarà la stessa. I corsivi e i grassetti il più delle volte non vengono presi e le righe appaiono “sballate”. Perciò, con questo post vedremo come copiare testo da PDF conservandone la formattazione.
Partiamo prima di tutto dalla spiegazione sulla natura del formato PDF (portable document format) che rappresenta documenti in maniera indipendente sia dall’hardware che dal software impiegati per crearli o per visualizzarli. In sostanza, nella maggioranza dei casi, i file PDF sono mappe contenenti la posizione esatta delle eventuali immagini e dei caratteri: la fine della parola o della frase però non viene quasi mai memorizzata, a meno che il file non sia stato generato sin da subito con questo obiettivo, cosa fra l’altro rarissima. Perciò, per copiare testo da documenti in formato PDF conservandone la formattazione è necessario agire solo a livello software in grado di portare a termine l’estrazione del testo, non limitandosi ai caratteri, ma come una forma di I.A. che cerca di comprendere quali caratteri costituiscono quella parola, quali quella frase, quali quel dato periodo e via dicendo. Considerando perciò che ogni file PDF presenta una struttura diversa, la soluzione su come copiare testo da documenti in formato PDF conservandone la formattazione comporta risultati finali quasi mai perfetti e l’utilizzo di svariati tool e programmini che consentono la conversione da PDF in HTML, RTF e Word producono risultati variabili che vanno dalla più che sufficienza alla totale inefficienza. Motivo per cui mantenere la formattazione dopo il copia e incolla del testo di un file PDF è assai difficile.



Molte volte durante l’uso del Pc veniamo fermati proprio da quest’ultimo per la lentezza. A volte è molto fastidioso specie quando si sta facendo una cosa importante. Questo effetto può essere causato da molti aspetti.
