SGML -
Standard Generalized Markup Language
Começamos por um
aviso: este tema é extremamente abstracto e díficil tanto de explicar como de entender.
Tentamos uma explicação aqui porque pensamos que pode ser relevante para enquadrar a
invenção da World Wide Web e perceber um pouco melhor a sua evolução previsível.
Os navios da marinha de
guerra podem carregar entre 10 a 40 toneladas de manuais e papéis. Dez toneladas de
manuais técnicos parece um pouco pesado, não é verdade? Pensemos na construção de uma
coisa complicada, como um avião. A criação do B2 implicou a
redacção de cerca de um milhão de páginas de manuais...
Numa sociedade em ritmo
acelerado e com produtos e sistemas cada vez mais sofisticados e complicados, havia que
arranjar formas novas para abordar a questão absolutamente incontornável da
documentação técnica subjacente, de modo a tornar o processo menos prene a erros, mais
eficiente e mais seguro. O SGML ("Linguagem Normalizada e Geral para
Etiquetagem") foi o ovo de Colombo da documentação técnica, sobretudo dos casos em
que já se sabe à partida que a documentação a produzir vai ser em quantidades
massivas, mas ainda não se sabe bem nem qual o resultado final, nem em que formato final
vai ser distribuida (em "livro", em relatórios separados, em vídeo, em CD-ROM,
como cassete audio, como uma combinação destas possibilidades...).
O SGML é um processo
que começou com a desconstrução do texto, de qualquer texto, mas sobretudo de textos de
carácter técnico. Os seus criadores decidiram que um documento pode ser
"desconstruído" (desmontado, repartido, analisado) em 3 vertentes: estrutura,
estilo e conteúdo. "Estrutura" tem a ver com os capítulos, as secções, as
sub-secções, os títulos, os parágrafos, etc. (género: "isto aqui é um
título", "este pedaço de texto, entre esta linha aqui e esta linha ali, é um
capítulo", "isto é um índice", etc.). Esta estrutura é
"traduzida" para o leitor através de uma dada abordagem visual, respeitando
determinadas convenções que asseguram a coerência da experiência de consulta (este é
o campo dos designer gráficos: usar certas cores nos títulos dos capítulos, usar
determinados tipos de letras, usar determinadas formatações para os cabeçalhos e
rodapés): o "estilo". E finalmente, estrutura e estilo devem, em princípio,
servir um conteúdo. Em função do tipo de conteúdo devem ser definidas, primeiro a
"estrutura" a adoptar e depois, as questões de "estilo" (embora seja
difícil explicar aos designer gráficos esta ordem das coisas...)
Em termos de SGML,
começa-se por descrever a estrutura a adoptar para um dado tipo de conteúdos. Esta
"descrição" é um documento altamente técnico e abstracto, redigido de acordo
com normas muito estritas, e tem um nome genérico: Definição do Tipo de Documento (ou,
no original, Document Type Definition), ou DTD. O DTD descreve todos os elementos
estruturais do documento e ignora completamente as questões de estilo, que pertencem a
outro tipo de preocupação (N.B.: a respectiva definição de "estilo" a
adoptar será objecto de outro documento, de descrição de estilos: a "folha de
estilos" ou, no original "stylesheet" -- esta é uma temática paralela que
não vai ser sequer enquadrada aqui). A cada elemento estrutural que é identificado
corresponde uma "etiqueta". Estas etiquetas deverão ser embebidas no corpo do
documento a criar.
Assim, por exemplo, a
um qualquer parágrafo de texto corrido corresponde forçosamente uma etiqueta, que o
identifica como tal (como texto de um parágrafo). O autor de um qualquer documento a ser
criado de acordo com as normas SGML, no quadro de um DTD determinado, quando o estiver a
redigir, terá de identificar cada parágrafo de texto corrido como tal, etiquetando-o
adequadamente (e cada título, e cada número de página, e cada lista, etc.).
Normalmente, estas etiquetas marcam o princípio e o fim de cada bloco de texto. Digamos
que a etiqueta definida no DTD para um parágrafo de texto corrido é a letra
"P". De acordo com as especificações SGML, este texto deve ser etiquetado com
um <P> no princípio do texto do parágrafo e com um </P> no fim (os
"<" e ">" são obrigatórios; o "/" marca o fim). O
autor do texto, quando o estiver efectivamente a escrever, deve etiquetar adequadamente
todas as peças do seu texto. Todas as peças do seu texto têm de ter uma etiqueta
"estrutural".
E,
pergunta-se, é este insano trabalho adicional que vai permitir maior produtividade?
- - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - -
| TOPO DA PÁGINA
| SECÇÃO ANTERIOR |