Documento strutturato

Un documento strutturato è un documento elettronico in cui alcuni metodi di codifica incorporati , come il mark-up , vengono utilizzati per attribuire all’intero e alle parti del documento vari significati strutturali secondo uno schema . Un documento strutturato il cui mark-up non infrange lo schema ed è progettato per conformarsi e che obbedisce alle regole di sintassi del suo linguaggio di mark-up è “ben formato”.

Lo standard SGML (General Generalized Markup Language ) ha aperto la strada al concetto di documenti strutturati

-  Pubblicazioni multiuso con HTML, XML e CSS , Håkon Wium Lie e Janne Saarela

A partire dal 2009 il linguaggio di markup più utilizzato , in tutte le sue forme in evoluzione, è HTML , che viene utilizzato per strutturare i documenti secondo lo schema DTD (Document Type Definition) definito e descritto dal W3C, che rivede, perfeziona ed evolve continuamente specifiche.

XML è il formato universale per documenti strutturati e dati sul Web

-  XHTML2 Working Group , W3C

Semantica strutturale

Nella stesura di documenti strutturati l’attenzione è incentrata sulla codifica della struttura logica di un documento, senza alcuna preoccupazione esplicita nel markup strutturale per la sua presentazione all’uomo da parte di pagine stampate, schermi o altri mezzi. I documenti strutturati, specialmente quelli ben formati, possono essere facilmente elaborati dai sistemi informatici per estrarre e presentare i metadati relativi al documento. Nella maggior parte degli articoli di Wikipedia, ad esempio, un sommario viene generato automaticamente dai diversi tag di intestazione nel corpo del documento. I processori di parole popolari possono avere questa funzione disponibile.

In HTML una parte della struttura logica di un documento può essere il corpo del documento; <body>, contenente un titolo di primo livello; <h1>e un paragrafo; <p>.

<body>

<h1>Structured document</h1>
<p>A <strong class="selflink">structured document</strong> is an <a href="/wiki/Electronic_document" title="Electronic document">electronic document</a> where some method of <a href="/w/index.php?title=Embedded_coding&action=edit&redlink=1" class="new" title="Embedded coding (page does not exist)">embedded coding</a>, such as <a href="/wiki/Markup_language" title="Markup language">markup</a>, is used to give the whole, and parts, of the document various structural meanings according to a <a href="/wiki/Schema" title="Schema">schema</a>.</p>

</body>

Una delle caratteristiche più interessanti dei documenti strutturati è che possono essere riutilizzati in molti contesti e presentati in vari modi su telefoni cellulari, schermi TV, sintetizzatori vocali e qualsiasi altro dispositivo che può essere programmato per elaborarli.

Altra semantica

Altro significato può essere ascritto al testo che non è strutturale. Nel frammento HTML sopra, c’è una marcatura semantica che non ha nulla a che fare con la struttura; il primo di questi, il <strong>tag, significa che il testo racchiuso dovrebbe avere una forte enfasi. In termini visivi questo è equivalente al grassetto, <b>tag, ma nei sintetizzatori vocali ciò significa che viene utilizzata un’inflessione vocale che dà forte enfasi. Il termine marcatura semantica esclude il markup come il tag grassetto che non ha altro significato se non un’istruzione per una visualizzazione visiva. Il tag forte significa che la presentazione del testo racchiuso dovrebbe avere una forte enfasi in tutte le forme di presentazione, non solo visive.
L’ancora<a>tag è un esempio più ovvio di markup semantico privo di struttura, con il suo attributo href significa che il testo che circonda è un hyperlink .

L’HTML dall’inizio aveva anche tag che davano semantica di presentazione, cioè c’erano tag per dare il testo in grassetto ( <b>) o in corsivo ( <i>), o per modificare le dimensioni dei caratteri o che avevano altri effetti sulla presentazione. [1] Le versioni moderne dei linguaggi di markup scoraggiano tale markup a favore dei fogli di stile . È possibile allegare fogli di stile diversi a qualsiasi markup, semantico o presentativo, per produrre presentazioni diverse. In HTML , tag come; <a>, <blockquote>, <em>, <strong>e altri non hanno un significato strutturale, ma hanno un significato.

Vedi anche

  • Processore di documenti
  • Documenti leggibili dalla macchina
  1. Salta su^ http://www.w3.org/MarkUp/draft-ietf-iiir-html-01.txt . Estratto il 5 marzo 2014 . Manca o svuota( aiuto ) |title=