Our website is made possible by displaying online advertisements to our visitors.
Please consider supporting us by disabling your ad blocker.

Responsive image


UTF-7

Série Unicode
Unicode
UCS
UTF-7
UTF-8
UTF-16
UTF-32/UCS-4
SCSU
Punycode

O UTF-7 (Formato de Transformação Unicode de 7 bits) é uma codificação de caracteres de tamanho variável capaz de representar um texto Unicode usando uma seqüência de caracteres ASCII. É usada principalmente em emails.

O principal padrão de transferência de email na Internet, o SMTP, define que somente caracteres ASCII devem ser usados, não permitindo que qualquer byte com valor superior aos definidos pelo padrão ASCII seja usado. MIME oferece uma maneira de especificar-se a codificação de caracteres utilizada permitindo o uso de outras opções como o UTF-8 ou UTF-16. Entretanto a infraestrutura de transmissão subjacente da internet ainda não é 8 bits compatível, consequentemente codificações de conteúdo para transferência devem ser utilizados. Dentre as opções de codificação de conteúdo para transferência, o base64 tem o problema de deixar ilegíveis mesmo os caracteres ASCII e o UTF-8 quoted-printable é bastante ineficiente utilizando entre 6 a 9 bytes para caracteres não-ASCII do Basic Multilingual Plane (BMP) e 12 bytes para os caracteres fora do BMP.

Se algumas regras forem seguidas durante a codificação, o UTF-7 pode ser enviado em um email sem utilizar-se uma seção MIME dedicada mas deve ser explicitamente identificada como a codificação de caracteres utilizada. Além disso, se for utilizado em cabeçalhos de email como "Subject:" o UTF-7 deverá estar contido em palavras codificadas MIME que identifiquem a codificação de caracteres utilizada. Como palavras codificadas exigem o uso de quoted-printable ou base64 o UTF-7 foi projetado para evitar o sinal = como caracteres especial, evitando assim o choque com o uso do = pelo quoted-printable.

O UTF-7 não é normalmente usado internamente em aplicações pois seu processamento é bastante desagradável. A criação do 8BITMIME reduziu a necessidade de codificar-se mensagens em formatos 7 bits compatíveis. Apesar de seu menor tamanho em relação ao uso combinado do UTF-8 com o quoted-printable ou base 64, o Consórcio sobre Correio da Internet (Internet Mail Consortium) recomenda que não se use o UTF-7.

Uma versão modificada do UTF-7 é usada pelo protocolo de recuperação de de mensagens IMAP para nomes de caixas postais. Veja a seção 5.1.3 do RFC 2060 para maiores detalhes.


Previous Page Next Page






UTF-7 Catalan UTF-7 German UTF-7 English UTF-7 Spanish UTF-7 French UTF-7 Italian UTF-7 Japanese UTF-7 Korean UTF-7 Polish UTF-7 Russian

Responsive image

Responsive image