CARACTERES ESPECIALES
Existen
ciertas exigencias de HTML respecto al uso de caracteres especiales,
denominación que incluye a las vocales acentuadas y a la letra eñe. Existen
también ciertas limitaciones relativas al uso de ciertos símbolos que
significan algo en HTML, como el de menor
que (<) o el signo inglés de and (llamado ampersand: &).
Trataremos primero el caso más sencillo. Existe una
razón evidente que impide que podamos escribir ciertos símbolos directamente en
un texto HTML, como por ejemplo el <: dichos símbolos tienen un significado
en HTML, y es necesario diferenciar claramente cuándo poseen ese significado y
cuándo queremos que aparezcan literalmente en el documento final. Por ejemplo,
como ya sabemos, < indica el comienzo de una directiva, y, por ello, si queremos
que aparezca en el texto como tal tendremos que dar un rodeo escribiendo algo que no de lugar a confusión,
en este caso <.
Los símbolos afectados por esta limitación, y la forma de escribirlos, se
detallan a continuación:
- < (Menor que): <
- > (Mayor que): >
- &
(símbolo de and,
o ampersand):
&
- " (comillas dobles): "
Es
decir, que para escribir <"> en nuestro texto HTML original debemos
poner <">.
El otro caso especial se da cuando en un texto HTML se
quiere escribir una eñe, por ejemplo. Existen dos formas de hacerlo. La
primera, que es a la que obliga el estándar de HTML, consiste en utilizar entidades, es decir, palabrejas como las que antes se
presentaron para escribir ciertos símbolos. Las entidades comienzan siempre con
el símbolo &, y terminan con
un punto y coma (;). Entre medias
va un identificador del carácter que queremos que se escriba. Las entidades
necesarias en nuestro idioma son:
- á: á
- é: é
- í: í
- ó: ó
- ú: ú
- Á: Á
- É: É
- Í: Í
- Ó: Ó
- Ú: Ú
- ü: ü
- Ü: Ü
- ñ: ñ
- Ñ: Ñ
- ¿:
¿
- ¡:
¡
Como puede verse, las vocales acentuadas se
identifican añadiendo el sufijo acute a la vocal sin acentuar (puesto que se trata de
un acento agudo). Para la u con diéresis y la eñe se usan uml tras una u y tilde detrás una ene, respectivamente. La
equivalencia de los signos de abrir interrogación y exclamación es algo más
oscura: a falta de una denominación más evidente, tenemos que usar el valor
numérico de dichos caracteres en el código estándar latin1 (ISO-8859-1). Esto
se puede hacer con cualquier otro carácter del código latin1, que es el código
de caracteres básico en HTML, escribiendo &#numero;.
La segunda manera, que sin duda es más cómoda,
consiste en no preocuparse por esta limitación y escribir literalmente los
caracteres afectados. A pesar de que este método suele funcionar en las
conexiones WWW directas (porque el protocolo HTTP, que transporta el HTML por
los vericuetos de Internet, requiere un canal de 8 bits), no tiene por qué
funcionar bien cuando los documentos HTML se envían por correo electrónico, por
ejemplo. Por tanto, y a pesar de los inconvenientes, es absolutamente
recomendable respetar la norma especificada en HTML.
|