Los documentos escritos en HTML estan estructurados en dos partes diferenciadas: la HEAD (cabecera) y el BODY (cuerpo).
Si escribes:
<HTML> <HEAD> <TITLE> Documento de prueba </TITLE> </HEAD> <!-- Esto es un comentario--> <BODY> <H1> Esto es una "demo" de documento HTML </H1> Esto es el más sencillo de los documentos HTML. </BODY> </HTML>
El elemento <HTML> </HTML> no es obligatorio. Solo sirve como identificación del tipo de contenido del fichero para ciertos programas que hacen cambios masivos en muchas páginas a la vez.
Para escribir comentarios en la página (que sólo se ven en el texto fuente, pero no en el visualizador) se utilizará el elemento <!-- -->
Puedes ver su aspecto real pulsando aquí.
Cuando un visualizador recibe un fichero, antes de mostrarlo
necesita saber el tipo de contenido que éste tiene, a fin de
procesarlo adecuadamente. No es lo mismo recibir un documento de
texto que una fotografía en formato GIF, o un vídeo en
formato MPG, o si lo que estamos intentando es transferir un fichero.
En cada caso, el visualizador pondrá en juego distintas
habilidades, de las muchas que posee.
Si el fichero procede de un
servidor http remoto, (es decir un servidor WWW; http
es el nombre del servicio invocado), éste se encargará
de decirle al visualizador cuanto necesite saber, pero si lo que hay
que procesar es un fichero local, la única forma de saberlo es
por la extensión del fichero.
La extensión de un fichero son las tres o cuatro letras (depende del sistema operativo con el que se trabaje) que hay después del nombre del fichero y que están separadas del mismo por un punto.
Por ejemplo, esta página se llama estruc.htm. Las tres letras que hay después del punto (htm) son la extensión del fichero. Las otras, las que están delante del punto, son el nombre del fichero.
Hay que tener presente que las extensiones de 4 o más
letras son propias de sistemas operativos como Unix, Macintosh o
Windows95 y las de 3 o menos del DOS.
Estas son algunas de las
extensiones stándard más comunes y sus contenidos:
.html
o .htm
.text
o .txt
.gif
.xbm
.xpm
.jpeg
o .jpg
.mpeg
o .mpg
.au
.mid
.avi
.exe
.hqx
.Z
o .zip
En el entorno WWW se utilizan los MIME types (Multipurpose Internet Mail Extension) para definir el tipo de un fichero transferido. El visualizador determina desde el MIME type cómo hay que tratar cada fichero.
Los visualizadores tienen una configuración de los mapas de tipos aceptables, e instrucciones de cómo proceder en cada caso. Algunos tipos son tratados directamente por el propio visualizador (p.ej.: htm, gif, txt) mientras que para otros necesitan de una herramienta auxiliar adecuada, que hay que indicar al visualizador, para que sea llamada en el momento preciso (p.ej.: zip, mpg, au).
Ahora que ya sabes qué son las extensiones de fichero, es el momento de aclarar una cuestión importante:
Los documentos HTML los puedes escribir con lo que quieras... Siempre que los salves en modo Solo Texto. Es decir, que si utilizas, por ejemplo, Word de Windows o de MAC, por defecto estos programas salvan en formato Word. Y aunque luego los renombres como documentos .htm o .html, el formato interno sigue siendo Word.
Tampoco vale dejarlos con la extensión .txt que les
dejan la mayoría de editores al salvarlos en modo Solo Texto.
No serían interpretados correctamente. Por lo tanto si tienen
extensión .txt (y por supuesto son .txt),
entonces puedes renombrarlos a .htm, o bien en el momento de
guardarlos en formato Solo Texto no dejar la extensión
por defecto .txt y darle ya directamente la extensión
.htm.
Algunos procesadores de texto, ya incluyen entre sus
tipos el .htm. Si es así lo que hacen es eliminar la
codificación propia, y convertirla a elementos de HTML. Por
ejemplo, si tienes un texto en itálica, automáticamente
es convertido al elemento <I>, etc..