logo

Sitio personal de Carlos D. González Buenos Aires - Argentina. Aquí encontrará información sobre mis cursos individuales y presenciales de diseño web profesional.

El menú que está debajo lo lleva a los distintos archivos temáticos RDF parseados, usted puede utilizarlos para encontrar una interfaz con información sobre una misma temática.

Parsing RDF

Sindicar RDF

Valid XHTML 1.1!

Valid CSS!

Web Standards

Creative Commons License

Web Design Group

Archivo RDF

[Valid RSS]

SGML, HTML y XML

Fecha: 16-10-18 Hora: 20: 11 : 38

SGML: norma ISO 8879:1986(E)

Relaciones entre los tres:

SGML

Es el origen de los otros dos. Describe miles de tipos de documentos.

HTML

  • Es el lenguaje de la Web
  • Es sólo un tipo de documento SGML

XML

  • Es una versión abreviada de SGML
  • Permite definir tipos de documentos específicos
  • Posibilita creación de aplicaciones que los traten
  • Omite complejidad de SGML, sin perder poder

SGML

Standard Generalized Markup Language.
Es el estándar internacional para la definición de la estructura y el contenido de diferentes tipos de documentos.

SGML: Origen y objetivos.

  • Surgió en la industria editorial para facilitar el intercambio de datos (composición tipográfica)
  • Ha evolucionado fuera de ese ámbito editorial para intercambio de información textual
  • Provee un marco para describir la estructura lógica de los documentos
  • Identifica los elementos estructurales o de contenido
  • Codifica las relaciones jerárquicas entre los elementos

SGML: Características

  • Los elementos de contenido están identificados a través de marcas embebidas, Ej. <title> el título </title>
  • Permite la creación de marcas definidas de acuerdo a las necesidades planteadas por la estructura lógica de un tipo de documento específico
  • El estándar SGML contiene reglas generales para describir tipos específicos de documentos: las Definiciones de Tipos de Documentos (DTD)

Las DTDs determinan:

  • Qué elementos están permitidos en un tipo de documento dado
  • Las relaciones entre los elementos

DTD

La DTD es un modelo abstracto del documento, similar a un modelo de datos que describe entidades y relaciones en un programa de BD.

En ambos casos los datos están estructurados:
  • BD (tablas con filas y columnas)
  • SGML marcas (tags) embebidas

Las DTDs pueden crearse para cada tipo de documento. Cada nuevo tipo requiere su propia DTD.

Creación de nuevas DTDs

Proceso de Análisis Documental: Se analiza una muestra representativa y se sintetiza la estructura encontrada, que se codifica formalmente en la DTD.
  • A partir de ese momento todos los documentos siguen este modelo
  • Si elementos necesarios evolucionan, debe reformularse la DTD
Grandes sectores industriales se unen para definir una DTD común para facilitar:
  • La consistencia
  • El intercambio
  • La reutilización de los documentos

HTML

Hyper Text Markup Language

Lenguaje para publicaciones tal que todas las computadoras puedan potencialmente entender.

HTML: Origen y objetivos

  • HTML 2.0 (noviembre 1995)
  • HTML +, HTML 3.0
  • HTML 3.2 (enero 1997)
  • HTML 4.0 (diciembre 1997, rev. abril 1998)
  • Mejoras: hojas de estilo, cuadros, objetos embebidos, textos de derecha a izquierda y direcciones mixtas, mejores tablas, enlaces a formularios y mejora el acceso para personas con discapacidades
  • Adopción del Estándar Internacional ISO/IEC 10646 (lenguajes universales)

HTML 4.0: Características

  • Publicar documentos online con encabezados, textos, tablas, listas, fotos, etc.
  • Recuperar información online via links de hypertextos
  • Diseñar formularios para transacciones con servicios remotos, para buscar información, hacer reservaciones, ordenar productos, etc.
  • Incluir spread-sheets, video clips, sound clips y otras aplicaciones relacionadas con los documentos
  • Distingue mejor entre estructura y presentación
  • Mejores formularios, claves de acceso, agrupamiento de controles, agrupa las opciones de selección
  • Posibilidad de marcar (tags) la descripción de un texto de un objeto incluido (con el elemento objeto)
  • Mecanismo (map) para que un autor pueda integrar imágenes con links de texto
  • El requerimiento que alterna texto acompañando imágenes incluidas con el elemento <img> y los mapas de imágenes incluyendo el elemento area
  • Soporte para atributos título <title> y lenguaje <lang> en todos los elementos, abreviatura <abbr> y acrónimo <acronym>
  • Un rango mayor de objetivos (target media) para usar con hojas de estilo
  • Mejores tablas incluyendo nombres, grupos de columnas y mecanismos no visuales de interpretación

HTML 4.0: Tablas

  • Mayor control sobre la estructura y diseño (layout)
  • Despliega los datos de la tabla de forma incremental

HTML 4.0: Doc. compuestos

Mecanismo estándar para embeber objetos media genéricos y aplicaciones. Provee un mecanismo para incluir:
  • Imágenes, video, sonido, elementos matemáticos, y aplicaciones especiales
  • Permite especificar la jerarquía de cargado de contenido alternativo para visualizadores que no soporten un cargado específico

HTML 4.0: Hojas de estilo

  • Simplifican el sistema de marcas de HTML
  • Les otorga, tanto al autor como al usuario, el control sobre la presentación de los documentos (información de la fuente, alineamiento, color)
  • Pueden estar embebidas en un documento HTML o en archivos externos
  • El mecanismo para asociar una hoja de estilo al documento es independiente del lenguaje de la hoja de estilo

HTML 4.0: Usos de scripts

  • Páginas Web Dinámicas
  • Usan HTML para construir aplicaciones en red
  • El mecanismo para incluir scripts a un documento HTML, es independiente del lenguaje del script

HTML 4.0: Impresión

Posibilita imprimir más allá de la página en pantalla creando relaciones entre documentos:
  • elemento link de HTML
  • RDF: Resource Description Language

XHTML 1.0

Reformulación del HTML 4.0 en XML 1.0
Documento de trabajo de W3C (editado 5/5/99)

XHTML es la base para una futura familia de tipos de documentos que son extensión y subconjunto de HTML.

Para qué se necesita XHTML
  • XHTML es diseñado para ser extensible
  • XHTML es diseñado para ser portable

XML: eXtensible Markup Language

El Lenguaje Extensible de Marcas es un subconjunto del SGML y se describe en la Recomendación W3C del 10/02/98. Resolverá los problemas más importantes que tiene la Web en la actualidad.

XML: Origen y objetivos

Es una actividad de la W3C para viabilizar la utilización de SGML en la WWW. Desarrollado entre 1996 y 1998 por un conjunto de expertos en lenguajes de marcas provenientes de la industria y la academia.

  • Eliminará la complejidad de SGML (difícil y costosa elaboración de programas y su utilización)
  • Posibilitará utilizar el SGML genérico de un modo tan sencillo como hoy es utilizado el HTML
  • XML será interoperativo con HTML y SGML

XML: Características

  • Reglas fáciles de seguir para crear un lenguaje de marcas determinado desde cero
  • Las marcas no tienen un significado predeterminado
  • Cualquiera puede entenderlas porque consisten en texto común
  • Transmite contenido y estructura
  • No transmite presentación ni comportamiento. Para que lo haga se le debe asociar mecanismos adicionales: Hojas de estilo (XSL o CSS)
Acuerdos realizados dentro de una industria para permitir resolver problemas específicos:
  • CML para la química
  • MathML para matemática
  • CDF, OFX, HDML, RDF, PGML

XML: Conceptos acerca del documento

Existen tres elementos claramente definidos:
  • Contenido
  • Estructura
  • Presentación

XML (y SGML) Concepto de documento

SGML y XML especifican:

Contenido y estructura permitiendo generar distintas presentaciones según la necesidad.

XML y las DTDs

  • SGML utiliza DTDs para la descripción de los elementos disponibles en un tipo de documento dado
  • El diseño y construcción de una DTD no es trivial
  • XML ha sido diseñado para ser utilizado con o sin DTDs
  • Doc. sin DTD: define sus propias marcas a través de la existencia y localización de elementos en el momento en que es creado

Un visualizador XML necesita entender la estructura de lo que está leyendo, esto introduce el concepto de:

  • Documento-bien-formado
  • Documento-válido (tiene una DTD asociada)

XML

Creará aplicaciones en la Web centradas en los datos:
  • Intercambio entre bases de datos
  • Agentes inteligentes podrán manipular el contenido de la información de acuerdo a las necesidades de los clientes
  • Gestión de las colecciones de documentos
  • Cambiará las publicaciones en la Web y, posteriormente también a las publicaciones en general
  • SGML y XML especifican el contenido y la estructura de un documento de forma tal que permiten generar distintas presentaciones de acuerdo a la necesidad.
  • Los distintos sistemas operativos serán transparentes para el usuario así como los idiomas (transculturalismo)

La familia XML

  • XML es un subconjunto de la ISO 8879 (SGML) diseñado para una fácil implementación por parte de los autores
  • XLL (eXtensible Linking Language) es un conjunto de estándares sobre mecanismo de hipertextualidad basados en la ISO/IEC 10744 y en la Text Encoding Initiative (TEI)
  • Permite nuevas maneras de enlazar la información
  • Promueve la creación de estructuras de información avanzadas y gestión de sitios Web
  • Viabiliza una industria dedicada a la gestión del conocimiento
  • Puede ser tan importante como el XML. (XLink y Xpointer)
  • XSL (eXtensible Stylesheet Language) es un lenguaje estándar sobre estilo para información estructurada que parte de la ISO/IEC 10179 (DSSSL) e incorpora conceptos claves de CCS

Hacia el Formato Universal

  • El futuro: un formato universal XML + XSL
  • La combinación XML+XSL puede remplazar a todos los procesadores de texto y formatos existentes
  • Un único formato para publicaciones impresas y electrónicas
  • Un único formato para diferentes tipos de productos
  • Un único formato para todos los idiomas

Implicancias económicas y políticas de la asociación XML + XSL

SGML/XML Europe 98, Paris, 19 May 1998 Jon Bosak (Sun MicroSystems)
  • Los usuarios no estarán más atados a un tipo comercial de software
  • Cambiarán las relaciones entre vendedores de software y clientes
  • Será el final de la dominación de unas pocas empresas gigantescas y de unos pocos países poderosos