Latex – Como os processadores de textos funcionam

Standard

Em um processador de texto WYSIWYG, como o Word ou Write, o processo de edição e impressão de textos é formado de apenas dois passos:

  1. Escrever, já formatando o texto
  2. Imprimir.

O resultado na tela do computador, o que você vê enquanto está digitando, é muito próximo do resultado que você obterá quando imprimir o documento. Os comandos que definem o formato do texto, dos tipos, dos parágrafos e mesmo das margens são invisíveis para o usuário final. Além disso, o engine que monta o texto na tela já se preocupa em apresentar o texto metaforicamente igual ao produto impresso. O processador de textos também se encarrega de converter o seu texto e os comandos de formatação em alguma coisa que a impressora entenda permitindo a impressão. Simples, belo e você precisa enxergar para fazer isso.

Sun OpenOffice.org Team
photo credit: jcorrius

Desculpe, eu me entusiasmei e saí escrevendo sem prestar a atenção. Pessoas da área de tecnologia da informação, sofredores que são, têm o péssimo hábito de usar palavras em inglês. Não sou diferente, tento me policiar mas, às vezes escapa. Usamos engine (motor em português) para indicar o programa, ou parte dele, que faz alguma coisa funcionar. A parte principal do Firefox, por exemplo, é o engine. Neste caso, o engine é responsável por montar a página na tela.

Aqui temos que fazer um novo parêntese: Até pouco tempo o formato proprietário da Microsoft para textos, o DOC era composto de comandos crípticos comprimidos em um formato proprietário que tornava praticamente impossível para uma pessoa comum, ler os códigos de formatação. Pessoas comuns que me desculpem, os nerds, leram o formato Word e até fizeram alguns aplicativos capazes de ler e gravar nesse formato.

Com o passar do tempo, evolução da Internet e criação de formatos abertos como o ODF, baseados em XML (outra linguagem de marcação) a Microsoft acabou por optar por um formato legível, por seres humanos, para ser usado nos processadores de texto para os comandos de formatação de texto. Este formato é conhecido como OpenXML. Arquivos criados nesse formato pelo Microsoft Word ou criados em ODF pelo OpenOffice Write podem ser lidos por seres humanos, entendidos e modificados sem a necessidade dos processadores de texto. Isso mesmo, você não está maluco.

Vou escrever de novo. Com o passar do tempo os processadores de texto passaram a usar uma linguagem de marcação para definir o formato do texto. Contudo, se você quiser imprimir estes artigos ainda precisará de um processador de textos capaz de abrir, entender e principalmente renderizar – lembra do renderizar? Uma espécie de sinônimo de montar – o texto em um formato metaforicamente igual ao que será impresso e converter esse formato em algo que as impressoras entendam. Simples?

Não se preocupe, ainda vai piorar muito antes de melhorar.