Definição – o que significa Unicode Transformation Format (UTF)?
O Unicode Transformation Format (UTF) é um formato de codificação de caracteres que pode codificar todos os pontos de código de caracteres possíveis em Unicode. O mais prolífico é o UTF-8, que é uma codificação de comprimento variável e usa unidades de código de 8 bits, projetadas para compatibilidade reversa com a codificação ASCII.
O Unicode Transformation Format também é conhecido como Universal Transformation Format.
Definirtec explica Unicode Transformation Format (UTF)
O Unicode Transformation Format é uma das duas codificações usadas em Unicode, sendo a outra o Universal Character Set (UCS). Ambos são usados para mapear o intervalo de pontos de código Unicode em sequências de valores de código denominados. Os números nos nomes da codificação indicam quantos bits estão sendo usados em um valor de código da codificação. Isso significa simplesmente que cada caractere único está sendo atribuído a um identificador de código chamado pontos de código.
Diferentes tipos de codificações UTF incluem:
- UTF-1 – antecessor aposentado do UTF-8, não faz mais parte do padrão Unicode
- UTF-7 – usa 7 bits para codificação e era usado principalmente em e-mail, mas agora é considerado obsoleto
- UTF-8 – usa uma codificação de largura variável de 8 bits para maximizar a compatibilidade com ASCII
- UTF-16 – codificação de largura variável de 16 bits
- UTF-32 – codificação de largura fixa de 32 bits
- UTF-EBCIDC – usa 8 bits e foi projetado para ser compatível com o código de intercâmbio decimal codificado binário estendido (EBCDIC)