Por que os arquivos PDF são gerados pelo Microsoft Word tão grandes?
Quando seus documentos são principalmente texto apenas na natureza, então parece que os tamanhos de arquivo para as versões .docx e .pdf devem ser bastante semelhantes quando salvos, mas isso nem sempre é o caso. A postagem de perguntas e respostas do SuperUser de hoje tem a resposta para as perguntas de um curioso leitor sobre a grande diferença no tamanho dos arquivos.
A sessão de perguntas e respostas de hoje nos é oferecida por cortesia do SuperUser - uma subdivisão do Stack Exchange, um agrupamento de sites de perguntas e respostas conduzido pela comunidade..
Luvas de boxe clip-art cortesia de Clker.com.
A questão
O leitor de superusuário Borek quer saber por que os arquivos PDF gerados pelo Microsoft Word são tão grandes:
Eu criei um documento simples do Microsoft Word contendo apenas esta frase, nada mais:
- Este é um pequeno documento.
Em seguida, salvei o documento como arquivos .docx e .pdf. Aqui estão os tamanhos dos arquivos:
- .docx: 12 kB
- .pdf: 89 kB
A diferença entre os dois arquivos é enorme (tecnicamente) e realmente me incomoda quando os documentos que são na sua maioria textuais são apenas dezenas de kB no formato .docx, mas são centenas de kB em tamanho quando convertidos para arquivos PDF. O que é tão ineficiente no formato PDF? É apenas o Microsoft Word usando algum algoritmo de saída terrível?
By the way, as configurações de saída PDF na minha instalação do Microsoft Office estão definidas para criar os menores arquivos possíveis:
Por que os arquivos PDF gerados pelo Microsoft Word são tão grandes??
A resposta
O rene colaborador do SuperUser tem a resposta para nós:
Se você abrir o arquivo PDF no Notepad ++, você encontrará:
E esse objeto é referenciado aqui no final da instrução / FontFile2:
As fontes usadas por um documento do Microsoft Word são incorporadas em arquivos PDF para que sejam autocontidas. Eu usei este deck de slides da Adobe para decifrar as instruções em PDF.
Se você quiser impedir que fontes sejam incorporadas em um arquivo PDF, certifique-se de que seus documentos do Microsoft Word usem um dos 14 tipos padrão disponíveis nos visualizadores de PDF (fonte: Wikipedia).
- Times New Roman> Times (v3) (em regular, itálico, negrito e negrito e itálico)
- Courier Novo> Courier (em oblíquo regular, oblíquo, negrito e em negrito)
- Arial> Helvética (v3) (em oblíqua regular, oblíqua, negrito e em negrito)
- Símbolo> Símbolo
- Wingdings> Zapf Dingbats
Tem algo a acrescentar à explicação? Som desligado nos comentários. Quer ler mais respostas de outros usuários do Stack Exchange com experiência em tecnologia? Confira o tópico de discussão completo aqui.