martedì 22 luglio 2008

Xhtml xml html e applicazioni web in genere - Il problema delle Entità

Molte volte capita di navigare su siti alla ricerca di informazioni su specifici argomenti e di dover cercare di agganciare il concetto espresso cercando di tradurre mentalmente i simboli che spesso compaiono all'interno dei paragrafi scritti.

I fatto che su parole compaiano dei simboli strani e che avvolte gli stessi non facciano comprendere le parole stesse è da imputarsi a diversi fattori.

Codifica del Documento

Il Primo posto fra tutti lo riserviamo alla codifica dei caratteri il famigerato charset del documento web cioè il "passaporto web" con cui viene codificato e spedito via web un documento che sia xhtml html 4 xml etc etc.
Il web da un pò di tempo a questa parte ha svoltato verso l'"UTF-8" che se da una parte permette la codifica di tutti i caratteri dall'altra utilizzando sequenze di byte dilungezza differente lascia spazio ad interpretazioni diverse (standard Unicode) che genera simbologia strana al posto del carattere digitato.
Quindi molti server restano aggrappati al vecchio "ISO 8859-1".

Quindi una codifica del docmento mal gestita comporta una simbologia visiva errata con una resa del documeto molto appesantita che non permette al visitatore di poter usufruire a pieno delle informazioni.
Scrivere parole con accenti e ritrovarsi invece simboli tipo questo ¿Ã non è il massimo.

Editor WEB
Un secondo problema, che concorre a rendere gli articoli web con buoni contenuti delle cose illeggibili, è rappresentato dagli editor che vengono utilizzati per creare le pagine web o i vari documenti.
Capita molto spesso di estrapolare contenuti da documenti di tipo doc e la magior parte delle volte tocca rimettere mano a tutto il codice.

Per chi ha un sito (per chi possiede un blog il discorso è diverso), e non ha molto tempo a disposizione, esistono degli editor, a parte il caro e vecchio notepad, che permettono di scrivere direttamente online il contenuto già adattato agli standard html (alcuni anche Xhtml).

Questi particolari editor testuali vengono chiamati WYSIWYG che sta per acronimo della frase "What You See Is What You Get" in italiano significa letteralmente quello che vedi è quello che prendi in altre parole quelo che scrivi sarà quello che preleverai e utilizzerai.

Ne esistono di diverse tipologie online e offline e tutte con prò e contro.
Rimando la discussione al prossimo post dove ne testeremo alcuni per provare a definire i migliori secondo alcuni canoni di resa web.

Entità
Altro fattore che potrebbe mettere al riparo da effetti visivi indesiderati e spesso mai preso in considerazione è quello di utilizzare le entità o entity.

L'utilizzo dei caratteri speciali resta ancora un pò tabù nella costruzione dei contenuti delle varie pagine web. Effettivamente tenere a mente tutti i codici dei caratteri non è molto semplice però ormai su internet esistono molti siti che danno ampia disponibilità sui vari codici.

vi segnalo questo link a riguardo sulle entity

Nessun commento: