Web Design  »  Articoli  »  Web design 

Ripuliamo l'HTML di Word

di: Cesare Lamanna     28 Aprile 2004

Office 2000 HTML Filter

Il primo tool che esaminiamo è offerto dalla stessa Microsoft. Si tratta di Office 2000 HTML Filter. Può essere scaricato gratuitamente dal sito di Microsoft e costituisce la soluzione ideale per chi opera con Word 2000. Il suo principale difetto, infatti, è di non poter essere installato in assenza di quella specifica versione. Abbiamo invano cercato un aggiornamento per versioni successive della suite (XP o 2003): peccato.

Una volta installato, si può accedere al programma dalla nuova voce creata nel menu Start. L'interfaccia è intuitiva. Attraverso la schermata iniziale è possibile innanzitutto aggiungere uno o più documenti Word salvati in precedenza come pagina web:

Schermata iniziale di Office 2000 HTML Filter

Il pulsante Options ci consente di accedere alla finestra delle impostazioni. Ecco quelle che abbiamo utilizzato nelle prove:

Finestra Opzioni di Office 2000 HTML Filter

Abbiamo optato per una pulizia completa. In questo modo vengono rimossi praticamente tutti i tag proprietari. Abbiamo lasciato intatta la prima opzione: in questo modo viene preservata una copia di backup del file originale. Il codice risultante è decisamente più maneggevole [Listato 3].

Dreamweaver

Il popolare web editor di Macromedia ha tra le sue funzionalità un comando (Commands > Clean Up Word HTML) che svolge la stessa funzione dell'Office 2000 HTML Filter. Sulla versione MX, è possibile intervenire su documenti Word salvati come pagina web dalla versione 97 a quella XP.

Sarà sufficiente aprire il documento generato da Word e sottoporlo alla ripulitura, impostando anche qui una serie di opzioni:

Impostazioni di base per Dreamweaver MX
Impostazioni avanzate per Dreamweaver MX

Il risultato è anche in questo caso egregio [Listato 4]. Dreamweaver mantiene, a differenza, del tool di Microsoft, il div contenitore con classe Section1 e l'attributo lang sull'elemento body. Tutto bene allora? Diciamo di sì, ma ricordiamo che Dreamweaver non è propriamente un software gratuito.

Word HTML Cleaner

Con l'ultimo strumento che presentiamo si ritorna al free. Con dei limiti, come vedremo. Word HTML Cleaner, creato e implementato da Dean Allen, è a mio parere la soluzione ideale per conversioni veloci ed episodiche. Non si installa sul proprio PC, essendo basato su uno script PHP eseguibile direttamente dal sito. L'uso è semplice. Si sceglie il documento conservato in locale, un click sul pulsante Process e lo script si occupa di svolgere il suo lavoro.

Alla fine si viene reindirizzati su una seconda pagina. All'interno di un'area di testo troveremo il codice ripulito da copiare e incollare nel nostro editor preferito:

Codice restituito da Word HTML Cleaner

Una particolarità dello script è che restituisce solo il corpo della pagina, senza la sezione head e i tag body e html di chiusura.

Il limite è che possiamo sottoporre allo script documenti non superiori ai 200kb. Se si vuole usarlo per dimensioni maggiori, l'autore chiede una donazione con PayPal.


Guide Web design

Guida Progettazione siti web

Dall'analisi dei requisiti fino allo sviluppo e alla promozione:...

Guida Pubblicare un sito web

Le verifiche fondamentali da effettuare prima del lancio di un nuovo...

Guida Architettura dell'Informazione

L'Architettura dell'informazione è la disciplina che permette di...

Altre guide

Newsletter @Grafica e Web Design

Ogni settimana, direttamente nella tua e-mail: guide, articoli, tutorial e FAQ su Web Design e grafica per il Web.

Iscriviti alla newsletter

Altre newsletter

Corsi in aula

Corso Google AdWords Base

25 Giugno 2012 a Milano
Disponibilità: 7 Posti

Corso Google AdWords Base

05 Giugno 2012 a Roma
Disponibilità: 7 Posti