SGML, HTML y XML
Fecha: 06-10-08 Hora: 11: 38 : 07
SGML: norma ISO 8879:1986(E)
Relaciones entre los tres:
SGML
Es el origen de los otros dos. Describe miles de tipos de documentos.
HTML
-
Es el lenguaje de la Web
-
Es sólo un tipo de documento SGML
XML
-
Es una versión abreviada de SGML
-
Permite definir tipos de documentos específicos
-
Posibilita creación de aplicaciones que los traten
-
Omite complejidad de SGML, sin perder poder
SGML
Standard Generalized Markup Language.
Es el estándar internacional para la definición de la estructura y el contenido de diferentes tipos de documentos.
SGML: Origen y objetivos.
-
Surgió en la industria editorial para facilitar el intercambio de datos (composición tipográfica)
-
Ha evolucionado fuera de ese ámbito editorial para intercambio de información textual
-
Provee un marco para describir la estructura lógica de los documentos
-
Identifica los elementos estructurales o de contenido
-
Codifica las relaciones jerárquicas entre los elementos
SGML: Características
-
Los elementos de contenido están identificados a través de marcas embebidas, Ej. <title> el título </title>
-
Permite la creación de marcas definidas de acuerdo a las necesidades planteadas por la estructura lógica de un tipo de documento específico
-
El estándar SGML contiene reglas generales para describir tipos específicos de documentos: las Definiciones de Tipos de Documentos (DTD)
Las DTDs determinan:
-
Qué elementos están permitidos en un tipo de documento dado
-
Las relaciones entre los elementos
DTD
La DTD es un modelo abstracto del documento, similar a un modelo de datos que describe entidades y relaciones en un programa de BD.
En ambos casos los datos están estructurados:
-
BD (tablas con filas y columnas)
-
SGML marcas (tags) embebidas
Las DTDs pueden crearse para cada tipo de documento. Cada nuevo tipo requiere su propia DTD.
Creación de nuevas DTDs
Proceso de Análisis Documental: Se analiza una muestra representativa y se sintetiza la estructura encontrada, que se codifica formalmente en la DTD.
-
A partir de ese momento todos los documentos siguen este modelo
-
Si elementos necesarios evolucionan, debe reformularse la DTD
Grandes sectores industriales se unen para definir una DTD común para facilitar:
-
La consistencia
-
El intercambio
-
La reutilización de los documentos
HTML
Hyper Text Markup Language
Lenguaje para publicaciones tal que todas las computadoras puedan potencialmente entender.
HTML: Origen y objetivos
-
HTML 2.0 (noviembre 1995)
-
HTML +, HTML 3.0
-
HTML 3.2 (enero 1997)
-
HTML 4.0 (diciembre 1997, rev. abril 1998)
-
Mejoras: hojas de estilo, cuadros, objetos embebidos, textos de derecha a izquierda y direcciones mixtas, mejores tablas, enlaces a formularios y mejora el acceso para personas con discapacidades
-
Adopción del Estándar Internacional ISO/IEC 10646 (lenguajes universales)
HTML 4.0: Características
-
Publicar documentos online con encabezados, textos, tablas, listas, fotos, etc.
-
Recuperar información online via links de hypertextos
-
Diseñar formularios para transacciones con servicios remotos, para buscar información, hacer reservaciones, ordenar productos, etc.
-
Incluir spread-sheets, video clips, sound clips y otras aplicaciones relacionadas con los documentos
-
Distingue mejor entre estructura y presentación
-
Mejores formularios, claves de acceso, agrupamiento de controles, agrupa las opciones de selección
-
Posibilidad de marcar (tags) la descripción de un texto de un objeto incluido (con el elemento objeto)
-
Mecanismo (map) para que un autor pueda integrar imágenes con links de texto
-
El requerimiento que alterna texto acompañando imágenes incluidas con el elemento <img> y los mapas de imágenes incluyendo el elemento area
-
Soporte para atributos título <title> y lenguaje <lang> en todos los elementos, abreviatura <abbr> y acrónimo <acronym>
-
Un rango mayor de objetivos (target media) para usar con hojas de estilo
-
Mejores tablas incluyendo nombres, grupos de columnas y mecanismos no visuales de interpretación
HTML 4.0: Tablas
-
Mayor control sobre la estructura y diseño (layout)
-
Despliega los datos de la tabla de forma incremental
HTML 4.0: Doc. compuestos
Mecanismo estándar para embeber objetos media genéricos y aplicaciones.
Provee un mecanismo para incluir:
-
Imágenes, video, sonido, elementos matemáticos, y aplicaciones especiales
-
Permite especificar la jerarquía de cargado de contenido alternativo para visualizadores que no soporten un cargado específico
HTML 4.0: Hojas de estilo
-
Simplifican el sistema de marcas de HTML
-
Les otorga, tanto al autor como al usuario, el control sobre la presentación de los documentos (información de la fuente, alineamiento, color)
-
Pueden estar embebidas en un documento HTML o en archivos externos
-
El mecanismo para asociar una hoja de estilo al documento es independiente del lenguaje de la hoja de estilo
HTML 4.0: Usos de scripts
-
Páginas Web Dinámicas
-
Usan HTML para construir aplicaciones en red
-
El mecanismo para incluir scripts a un documento HTML, es independiente del lenguaje del script
HTML 4.0: Impresión
Posibilita imprimir más allá de la página en pantalla creando relaciones entre documentos:
-
elemento link de HTML
-
RDF: Resource Description Language
XHTML 1.0
Reformulación del HTML 4.0 en XML 1.0
Documento de trabajo de W3C (editado 5/5/99)
XHTML es la base para una futura familia de tipos de documentos que son extensión y subconjunto de HTML.
Para qué se necesita XHTML
-
XHTML es diseñado para ser extensible
-
XHTML es diseñado para ser portable
XML: eXtensible Markup Language
El Lenguaje Extensible de Marcas es un subconjunto del SGML y se describe en la Recomendación W3C del 10/02/98.
Resolverá los problemas más importantes que tiene la Web en la actualidad.
XML: Origen y objetivos
Es una actividad de la W3C para viabilizar la utilización de SGML en la WWW. Desarrollado entre 1996 y 1998 por un conjunto de expertos en lenguajes de marcas provenientes de la industria y la academia.
-
Eliminará la complejidad de SGML (difícil y costosa elaboración de programas y su utilización)
-
Posibilitará utilizar el SGML genérico de un modo tan sencillo como hoy es utilizado el HTML
-
XML será interoperativo con HTML y SGML
XML: Características
-
Reglas fáciles de seguir para crear un lenguaje de marcas determinado desde cero
-
Las marcas no tienen un significado predeterminado
-
Cualquiera puede entenderlas porque consisten en texto común
-
Transmite contenido y estructura
-
No transmite presentación ni comportamiento. Para que lo haga se le debe asociar mecanismos adicionales: Hojas de estilo (XSL o CSS)
Acuerdos realizados dentro de una industria para permitir resolver problemas específicos:
-
CML para la química
-
MathML para matemática
-
CDF, OFX, HDML, RDF, PGML
XML: Conceptos acerca del documento
Existen tres elementos claramente definidos:
-
Contenido
-
Estructura
-
Presentación
XML (y SGML) Concepto de documento
SGML y XML especifican:
Contenido y estructura permitiendo generar distintas presentaciones según la necesidad.
XML y las DTDs
-
SGML utiliza DTDs para la descripción de los elementos disponibles en un tipo de documento dado
-
El diseño y construcción de una DTD no es trivial
-
XML ha sido diseñado para ser utilizado con o sin DTDs
-
Doc. sin DTD: define sus propias marcas a través de la existencia y localización de elementos en el momento en que es creado
Un visualizador XML necesita entender la estructura de lo que está leyendo, esto introduce el concepto de:
-
Documento-bien-formado
-
Documento-válido (tiene una DTD asociada)
XML
Creará aplicaciones en la Web centradas en los datos:
-
Intercambio entre bases de datos
-
Agentes inteligentes podrán manipular el contenido de la información de acuerdo a las necesidades de los clientes
-
Gestión de las colecciones de documentos
-
Cambiará las publicaciones en la Web y, posteriormente también a las publicaciones en general
-
SGML y XML especifican el contenido y la estructura de un documento de forma tal que permiten generar distintas presentaciones de acuerdo a la necesidad.
-
Los distintos sistemas operativos serán transparentes para el usuario así como los idiomas (transculturalismo)
La familia XML
-
XML es un subconjunto de la ISO 8879 (SGML) diseñado para una fácil implementación por parte de los autores
-
XLL (eXtensible Linking Language) es un conjunto de estándares sobre mecanismo de hipertextualidad basados en la ISO/IEC 10744 y en la Text Encoding Initiative (TEI)
-
Permite nuevas maneras de enlazar la información
-
Promueve la creación de estructuras de información avanzadas y gestión de sitios Web
-
Viabiliza una industria dedicada a la gestión del conocimiento
-
Puede ser tan importante como el XML. (XLink y Xpointer)
-
XSL (eXtensible Stylesheet Language) es un lenguaje estándar sobre estilo para información estructurada que parte de la ISO/IEC 10179 (DSSSL) e incorpora conceptos claves de CCS
Hacia el Formato Universal
-
El futuro: un formato universal XML + XSL
-
La combinación XML+XSL puede remplazar a todos los procesadores de texto y formatos existentes
-
Un único formato para publicaciones impresas y electrónicas
-
Un único formato para diferentes tipos de productos
-
Un único formato para todos los idiomas
Implicancias económicas y políticas de la asociación XML + XSL
SGML/XML Europe 98, Paris, 19 May 1998
Jon Bosak (Sun MicroSystems)
-
Los usuarios no estarán más atados a un tipo comercial de software
-
Cambiarán las relaciones entre vendedores de software y clientes
-
Será el final de la dominación de unas pocas empresas gigantescas y de unos pocos países poderosos