Consulta de Tabela ASCII
Referência completa de códigos de caracteres ASCII com caracteres de controle, imprimíveis e estendidos
| Decimal | Hex | Caractere | Descrição | |
|---|---|---|---|---|
| 0 | 0x00 | - | Caractere nulo | |
| 1 | 0x01 | - | Início de Cabeçalho | |
| 2 | 0x02 | - | Início de Texto | |
| 3 | 0x03 | - | Fim de Texto | |
| 4 | 0x04 | - | Fim de Transmissão | |
| 5 | 0x05 | - | Consulta | |
| 6 | 0x06 | - | Reconhecimento | |
| 7 | 0x07 | - | Campainha | |
| 8 | 0x08 | - | Backspace | |
| 9 | 0x09 | - | Tabulação Horizontal | |
| 10 | 0x0A | - | Line Feed | |
| 11 | 0x0B | - | Tabulação Vertical | |
| 12 | 0x0C | - | Form Feed | |
| 13 | 0x0D | - | Carriage Return | |
| 14 | 0x0E | - | Shift Out | |
| 15 | 0x0F | - | Shift In | |
| 16 | 0x10 | - | Data Link Escape | |
| 17 | 0x11 | - | Controle de Dispositivo 1 | |
| 18 | 0x12 | - | Controle de Dispositivo 2 | |
| 19 | 0x13 | - | Controle de Dispositivo 3 | |
| 20 | 0x14 | - | Controle de Dispositivo 4 | |
| 21 | 0x15 | - | Reconhecimento Negativo | |
| 22 | 0x16 | - | Synchronous Idle | |
| 23 | 0x17 | - | Fim do Bloco de Transmissão | |
| 24 | 0x18 | - | Cancelar | |
| 25 | 0x19 | - | Fim de Mídia | |
| 26 | 0x1A | - | Substituto | |
| 27 | 0x1B | - | Escape | |
| 28 | 0x1C | - | Separador de Arquivo | |
| 29 | 0x1D | - | Separador de Grupo | |
| 30 | 0x1E | - | Separador de Registro | |
| 31 | 0x1F | - | Separador de Unidade | |
| 127 | 0x7F | - | Deletar | |
| 32 | 0x20 | ␣ | Espaço | |
| 33 | 0x21 | ! | Ponto de exclamação | |
| 34 | 0x22 | " | Aspas duplas | |
| 35 | 0x23 | # | Sinal de número | |
| 36 | 0x24 | $ | Sinal de dólar | |
| 37 | 0x25 | % | Sinal de porcentagem | |
| 38 | 0x26 | & | E comercial | |
| 39 | 0x27 | ' | Aspas simples | |
| 40 | 0x28 | ( | Parêntese esquerdo | |
| 41 | 0x29 | ) | Parêntese direito | |
| 42 | 0x2A | * | Asterisco | |
| 43 | 0x2B | + | Sinal de mais | |
| 44 | 0x2C | , | Vírgula | |
| 45 | 0x2D | - | Hífen | |
| 46 | 0x2E | . | Ponto final | |
| 47 | 0x2F | / | Barra | |
| 48 | 0x30 | 0 | Dígito 0 | |
| 49 | 0x31 | 1 | Dígito 1 | |
| 50 | 0x32 | 2 | Dígito 2 | |
| 51 | 0x33 | 3 | Dígito 3 | |
| 52 | 0x34 | 4 | Dígito 4 | |
| 53 | 0x35 | 5 | Dígito 5 | |
| 54 | 0x36 | 6 | Dígito 6 | |
| 55 | 0x37 | 7 | Dígito 7 | |
| 56 | 0x38 | 8 | Dígito 8 | |
| 57 | 0x39 | 9 | Dígito 9 | |
| 58 | 0x3A | : | Dois pontos | |
| 59 | 0x3B | ; | Ponto e vírgula | |
| 60 | 0x3C | < | Menor que | |
| 61 | 0x3D | = | Sinal de igual | |
| 62 | 0x3E | > | Maior que | |
| 63 | 0x3F | ? | Ponto de interrogação | |
| 64 | 0x40 | @ | Arroba | |
| 65 | 0x41 | A | A maiúsculo | |
| 66 | 0x42 | B | B maiúsculo | |
| 67 | 0x43 | C | C maiúsculo | |
| 68 | 0x44 | D | D maiúsculo | |
| 69 | 0x45 | E | E maiúsculo | |
| 70 | 0x46 | F | F maiúsculo | |
| 71 | 0x47 | G | G maiúsculo | |
| 72 | 0x48 | H | H maiúsculo | |
| 73 | 0x49 | I | I maiúsculo | |
| 74 | 0x4A | J | J maiúsculo | |
| 75 | 0x4B | K | K maiúsculo | |
| 76 | 0x4C | L | L maiúsculo | |
| 77 | 0x4D | M | M maiúsculo | |
| 78 | 0x4E | N | N maiúsculo | |
| 79 | 0x4F | O | O maiúsculo | |
| 80 | 0x50 | P | P maiúsculo | |
| 81 | 0x51 | Q | Q maiúsculo | |
| 82 | 0x52 | R | R maiúsculo | |
| 83 | 0x53 | S | S maiúsculo | |
| 84 | 0x54 | T | T maiúsculo | |
| 85 | 0x55 | U | U maiúsculo | |
| 86 | 0x56 | V | V maiúsculo | |
| 87 | 0x57 | W | W maiúsculo | |
| 88 | 0x58 | X | X maiúsculo | |
| 89 | 0x59 | Y | Y maiúsculo | |
| 90 | 0x5A | Z | Z maiúsculo | |
| 91 | 0x5B | [ | Colchete esquerdo | |
| 92 | 0x5C | \ | Barra invertida | |
| 93 | 0x5D | ] | Colchete direito | |
| 94 | 0x5E | ^ | Acento circunflexo | |
| 95 | 0x5F | _ | Underscore | |
| 96 | 0x60 | ` | Acento grave | |
| 97 | 0x61 | a | a minúsculo | |
| 98 | 0x62 | b | b minúsculo | |
| 99 | 0x63 | c | c minúsculo | |
| 100 | 0x64 | d | d minúsculo | |
| 101 | 0x65 | e | e minúsculo | |
| 102 | 0x66 | f | f minúsculo | |
| 103 | 0x67 | g | g minúsculo | |
| 104 | 0x68 | h | h minúsculo | |
| 105 | 0x69 | i | i minúsculo | |
| 106 | 0x6A | j | j minúsculo | |
| 107 | 0x6B | k | k minúsculo | |
| 108 | 0x6C | l | l minúsculo | |
| 109 | 0x6D | m | m minúsculo | |
| 110 | 0x6E | n | n minúsculo | |
| 111 | 0x6F | o | o minúsculo | |
| 112 | 0x70 | p | p minúsculo | |
| 113 | 0x71 | q | q minúsculo | |
| 114 | 0x72 | r | r minúsculo | |
| 115 | 0x73 | s | s minúsculo | |
| 116 | 0x74 | t | t minúsculo | |
| 117 | 0x75 | u | u minúsculo | |
| 118 | 0x76 | v | v minúsculo | |
| 119 | 0x77 | w | w minúsculo | |
| 120 | 0x78 | x | x minúsculo | |
| 121 | 0x79 | y | y minúsculo | |
| 122 | 0x7A | z | z minúsculo | |
| 123 | 0x7B | { | Chave esquerda | |
| 124 | 0x7C | | | Barra vertical | |
| 125 | 0x7D | } | Chave direita | |
| 126 | 0x7E | ~ | Til | |
| 128 | 0x80 | | ||
| 129 | 0x81 | | ||
| 130 | 0x82 | | ||
| 131 | 0x83 | | ||
| 132 | 0x84 | | ||
| 133 | 0x85 | |||
| 134 | 0x86 | | ||
| 135 | 0x87 | | ||
| 136 | 0x88 | | ||
| 137 | 0x89 | | ||
| 138 | 0x8A | | ||
| 139 | 0x8B | | ||
| 140 | 0x8C | | ||
| 141 | 0x8D | | ||
| 142 | 0x8E | | ||
| 143 | 0x8F | | ||
| 144 | 0x90 | | ||
| 145 | 0x91 | | ||
| 146 | 0x92 | | ||
| 147 | 0x93 | | ||
| 148 | 0x94 | | ||
| 149 | 0x95 | | ||
| 150 | 0x96 | | ||
| 151 | 0x97 | | ||
| 152 | 0x98 | | ||
| 153 | 0x99 | | ||
| 154 | 0x9A | | ||
| 155 | 0x9B | | ||
| 156 | 0x9C | | ||
| 157 | 0x9D | | ||
| 158 | 0x9E | | ||
| 159 | 0x9F | | ||
| 160 | 0xA0 | |||
| 161 | 0xA1 | ¡ | ||
| 162 | 0xA2 | ¢ | ||
| 163 | 0xA3 | £ | ||
| 164 | 0xA4 | ¤ | ||
| 165 | 0xA5 | ¥ | ||
| 166 | 0xA6 | ¦ | ||
| 167 | 0xA7 | § | ||
| 168 | 0xA8 | ¨ | ||
| 169 | 0xA9 | © | ||
| 170 | 0xAA | ª | ||
| 171 | 0xAB | « | ||
| 172 | 0xAC | ¬ | ||
| 173 | 0xAD | | ||
| 174 | 0xAE | ® | ||
| 175 | 0xAF | ¯ | ||
| 176 | 0xB0 | ° | ||
| 177 | 0xB1 | ± | ||
| 178 | 0xB2 | ² | ||
| 179 | 0xB3 | ³ | ||
| 180 | 0xB4 | ´ | ||
| 181 | 0xB5 | µ | ||
| 182 | 0xB6 | ¶ | ||
| 183 | 0xB7 | · | ||
| 184 | 0xB8 | ¸ | ||
| 185 | 0xB9 | ¹ | ||
| 186 | 0xBA | º | ||
| 187 | 0xBB | » | ||
| 188 | 0xBC | ¼ | ||
| 189 | 0xBD | ½ | ||
| 190 | 0xBE | ¾ | ||
| 191 | 0xBF | ¿ | ||
| 192 | 0xC0 | À | ||
| 193 | 0xC1 | Á | ||
| 194 | 0xC2 | Â | ||
| 195 | 0xC3 | Ã | ||
| 196 | 0xC4 | Ä | ||
| 197 | 0xC5 | Å | ||
| 198 | 0xC6 | Æ | ||
| 199 | 0xC7 | Ç | ||
| 200 | 0xC8 | È | ||
| 201 | 0xC9 | É | ||
| 202 | 0xCA | Ê | ||
| 203 | 0xCB | Ë | ||
| 204 | 0xCC | Ì | ||
| 205 | 0xCD | Í | ||
| 206 | 0xCE | Î | ||
| 207 | 0xCF | Ï | ||
| 208 | 0xD0 | Ð | ||
| 209 | 0xD1 | Ñ | ||
| 210 | 0xD2 | Ò | ||
| 211 | 0xD3 | Ó | ||
| 212 | 0xD4 | Ô | ||
| 213 | 0xD5 | Õ | ||
| 214 | 0xD6 | Ö | ||
| 215 | 0xD7 | × | ||
| 216 | 0xD8 | Ø | ||
| 217 | 0xD9 | Ù | ||
| 218 | 0xDA | Ú | ||
| 219 | 0xDB | Û | ||
| 220 | 0xDC | Ü | ||
| 221 | 0xDD | Ý | ||
| 222 | 0xDE | Þ | ||
| 223 | 0xDF | ß | ||
| 224 | 0xE0 | à | ||
| 225 | 0xE1 | á | ||
| 226 | 0xE2 | â | ||
| 227 | 0xE3 | ã | ||
| 228 | 0xE4 | ä | ||
| 229 | 0xE5 | å | ||
| 230 | 0xE6 | æ | ||
| 231 | 0xE7 | ç | ||
| 232 | 0xE8 | è | ||
| 233 | 0xE9 | é | ||
| 234 | 0xEA | ê | ||
| 235 | 0xEB | ë | ||
| 236 | 0xEC | ì | ||
| 237 | 0xED | í | ||
| 238 | 0xEE | î | ||
| 239 | 0xEF | ï | ||
| 240 | 0xF0 | ð | ||
| 241 | 0xF1 | ñ | ||
| 242 | 0xF2 | ò | ||
| 243 | 0xF3 | ó | ||
| 244 | 0xF4 | ô | ||
| 245 | 0xF5 | õ | ||
| 246 | 0xF6 | ö | ||
| 247 | 0xF7 | ÷ | ||
| 248 | 0xF8 | ø | ||
| 249 | 0xF9 | ù | ||
| 250 | 0xFA | ú | ||
| 251 | 0xFB | û | ||
| 252 | 0xFC | ü | ||
| 253 | 0xFD | ý | ||
| 254 | 0xFE | þ | ||
| 255 | 0xFF | ÿ |
O que é ASCII?
ASCII (American Standard Code for Information Interchange) é um padrão de codificação de caracteres baseado no alfabeto latino. Originalmente desenvolvido para comunicação telegráfica, tornou-se o sistema fundamental de codificação de caracteres em computação. ASCII padrão contém 128 caracteres (0-127), incluindo 33 caracteres de controle e 95 caracteres imprimíveis. Uma tabela ASCII é especialmente útil para depurar codificações, caracteres de controle, protocolos, sequências de escape, terminais e formatos antigos. Valores decimais, hexadecimais e binários mostram como um caractere é armazenado ou transmitido de fato. Textos modernos geralmente usam Unicode, então ASCII cobre apenas o núcleo histórico de 7 bits. Para caracteres internacionais, emojis, sinais tipográficos e textos multilíngues, ainda é necessário verificar code points Unicode e regras de codificação.
Como Usar
Operações Básicas
- Clique em qualquer valor ou caractere para copiá-lo.
- Use a caixa de busca para localizar caracteres específicos rapidamente.
- Clique nos botões de categoria para filtrar por tipo de caractere.
- Passe o mouse sobre os caracteres para ver descrições detalhadas.
Observações sobre Codificação
- O ASCII cobre apenas a faixa 0-127; letras acentuadas, emojis e a maior parte dos textos não ingleses exigem codificações Unicode como UTF-8.
- Os caracteres de controle podem não ser visíveis, mas ainda afetam arquivos, terminais, protocolos e textos colados.
Casos de uso
Princípio técnico
ASCII (American Standard Code for Information Interchange, ANSI X3.4-1968, ISO/IEC 646:1991 IRV) é uma codificação de caracteres de 7 bits que atribui códigos numéricos 0-127 a 128 caracteres. Os 32 primeiros códigos (0x00-0x1F) mais 0x7F são caracteres de controle herdados de telex: NUL (0x00), BEL (0x07, o alerta sonoro), LF (0x0A, line feed), CR (0x0D, carriage return), ESC (0x1B), DEL (0x7F), entre outros. Os códigos 0x20-0x7E são imprimíveis: espaço, os dígitos 0-9 em 0x30-0x39, as letras maiúsculas A-Z em 0x41-0x5A, as letras minúsculas a-z em 0x61-0x7A e pontuação entre eles. A codificação tem uma estrutura deliberadamente regular. Os dígitos são agrupados: '0' = 0x30, '1' = 0x31, ..., '9' = 0x39. Converter um caractere de dígito em seu valor numérico é `code - 0x30`. As letras também são agrupadas: 'A' = 0x41, 'B' = 0x42, ..., 'Z' = 0x5A, e 'a' = 0x61, ..., 'z' = 0x7A. A diferença entre maiúsculas e minúsculas para a mesma letra é 0x20 (32), que é exatamente um bit definido na posição 5 (1 << 5 = 32). Isso torna a conversão de maiúsculas/minúsculas um único XOR ou OR/AND com 0x20: `code ^ 0x20` inverte maiúsculas/minúsculas, `code | 0x20` converte para minúsculas, `code & 0x5F` (= `code & ~0x20`) converte para maiúsculas. Esse truque de bit é a conversão de caso mais rápida possível e aparece em implementações de strlen/strcmp para strings somente ASCII. O ASCII foi projetado para telex de 7 bits e o código Baudot de 5 níveis que o precedeu, então é anterior aos bytes de 8 bits. A faixa de 'ASCII estendido' de 8 bits (0x80-0xFF) nunca foi padronizada, razão pela qual tantas páginas de código (ISO 8859-1 Latin-1, Windows-1252, MacRoman, KOI8-R, IBM437) competiram pela metade superior. ISO 8859-1 (Latin-1) era o mais próximo de um padrão, mas mesmo ele não tinha o símbolo do Euro até ISO 8859-15. A faixa de controle C1 (0x80-0x9F) deveria ser reservada (ISO 6429), mas Windows-1252 reutilizou parte dela para caracteres imprimíveis — um ponto de dor de interoperabilidade de longa data que o UTF-8 finalmente resolveu. UTF-8 (RFC 3629, 2003) foi projetado por Rob Pike e Ken Thompson em 1992 como um superset retrocompatível: os 128 códigos ASCII se codificam como bytes únicos (0x00-0x7F), então qualquer texto ASCII também é um texto UTF-8 válido. Códigos acima de 0x7F usam sequências de 2, 3 ou 4 bytes com padrões de bits específicos (110xxxxx 10xxxxxx, 1110xxxx 10xxxxxx 10xxxxxx, 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx) para que um decodificador possa ressincronizar byte a byte após um erro. O EBCDIC, por outro lado, era a codificação de 8 bits para mainframes da IBM (EBCDIC de 8 bits era de 8 bits, não de 7 bits como ASCII) e atribui letras a code points não contíguos ('A' = 0xC1, 'I' = 0xC9, 'J' = 0xD1, ..., com lacunas que prejudicam truques de bits e algoritmos de string). Variantes nacionais do ISO 646 substituíram um pequeno conjunto de caracteres ASCII por letras específicas de cada país. Por exemplo, a variante britânica substituiu 0x23 (o '#' americano) pelo símbolo da libra '£', e a variante alemã substituiu parte da pontuação por acentos. É por isso que as configurações de locale do C e os arquivos charmap do POSIX eram historicamente importantes — eles mapeavam entre o IRV (International Reference Version) e as variantes nacionais. A saída desse emaranhado é Unicode / UTF-8, que torna todo o debate de 7 bits e 8 bits obsoleto para qualquer projeto novo.
- ASCII (ANSI X3.4-1968, ISO/IEC 646 IRV) usa 7 bits por caractere com 128 code points: 33 caracteres de controle (0x00-0x1F, 0x7F) e 95 caracteres imprimíveis (0x20-0x7E).
- Caracteres de controle (0x00-0x1F, 0x7F) foram herdados de telex: NUL, BEL (0x07, alerta sonoro), LF (0x0A), CR (0x0D), ESC (0x1B), DEL (0x7F). Textos modernos ainda usam LF e CR; o resto é quase todo história.
- Layout imprimível: espaço (0x20), dígitos '0'-'9' (0x30-0x39), maiúsculas 'A'-'Z' (0x41-0x5A), minúsculas 'a'-'z' (0x61-0x7A), pontuação entre eles. Converter '5' para 5 é `code - 0x30`; maiúscula para minúscula é `code | 0x20`.
- A conversão de maiúsculas/minúsculas é uma única operação de bit: XOR 0x20 inverte; OR 0x20 converte para minúsculas; AND 0x5F (= `code & ~0x20`) converte para maiúsculas. Esta é a conversão de caso mais rápida em qualquer linguagem e é como strlen/strcmp funcionam em buffers somente ASCII.
- Extensões de 8 bits (0x80-0xFF) nunca foram padronizadas, então Windows-1252, ISO-8859-1, MacRoman, KOI8-R, IBM437 definiram a metade superior de forma diferente. Windows-1252 venceu na web e é o 'ASCII estendido' de fato que a maioria do código legado usa.
- UTF-8 (RFC 3629, Pike & Thompson 1992) é um superset estrito de ASCII: os 128 code points ASCII se codificam como eles mesmos em 1 byte; code points acima de U+007F usam 2-4 bytes com bytes de continuação 110xxxxx 10xxxxxx, para que decodificadores possam ressincronizar byte a byte após erros.
- EBCDIC (IBM, mainframes dos anos 1960) é a alternativa de 8 bits ao ASCII usada no IBM z/OS. As posições das letras não são contíguas ('A'=0xC1, 'I'=0xC9, 'J'=0xD1), então o truque de conversão de caso ASCII não funciona e algoritmos de bit-shift como tolower() precisam de tabelas de consulta.
- Variantes nacionais do ISO 646 (britânica, alemã, sueca, etc.) substituíram um pequeno conjunto de caracteres ASCII por letras específicas de cada país: a variante britânica trocou '#' por '£' em 0x23, a variante alemã trocou pontuação por acentos. Localização pré-Unicode em poucas palavras.
Exemplos
Consulta rápida de caracteres
Caractere: 'A'
Decimal: 65
Hex: 0x41
Binário: 01000001
Octal: 0101
Escape C: \x41 ('\x41' em C / C++ / Python / JavaScript)
A diferença entre maiúsculas e minúsculas é 0x20 (32 decimal):
'a' = 0x61 (97) = 'A' (0x41) + 0x20
'A' = 0x41 (65) = 'a' (0x61) - 0x20
É por isso que alternar o bit 5 (máscara 0x20) inverte a caixa de uma letra.
ch ^ 0x20 inverte A <-> a (funciona para A-Z, a-z, deixa os demais inalterados)Depuração de problemas com quebras de linha
LF (0x0A, decimal 10) - Unix, Linux, macOS moderno '\n'
CR (0x0D, decimal 13) - Mac OS clássico (pré-OS X), alguns protocolos de rede '\r'
CRLF (0x0D 0x0A, '13 10') - Windows, HTTP, SMTP, FTP '\r\n'
Dump hex de um arquivo 'hi\r\n' salvo no Windows:
0000: 68 69 0d 0a hi..
Dump hex do mesmo conteúdo salvo no Linux ('hi\n'):
0000: 68 69 0a hi.
Efeito na contagem de linhas:
$ wc -l windows.txt unix.txt
1 windows.txt (1 quebra de linha, 0x0D 0x0A)
1 unix.txt (1 quebra de linha, 0x0A)
A contagem de bytes difere (4 vs 3) e ferramentas como dos2unix detectam
varrendo pares 0x0D 0x0A e removendo o 0x0D.Referência de codificação de URL
Conjunto não reservado + reservado da RFC 3986 (o restante deve ser codificado em percent-encoding):
não reservado A-Z a-z 0-9 - _ . ~
reservado ! * ' ( ) ; : @ & = + $ , / ? # [ ]
codifique todo o resto como %HH, onde HH é o hex de 2 dígitos em maiúsculas
Caracteres comuns:
espaço 0x20 -> %20 (ou '+' dentro de application/x-www-form-urlencoded)
! 0x21 -> %21
" 0x22 -> %22
# 0x23 -> %23
$ 0x24 -> %24
% 0x25 -> %25
& 0x26 -> %26 (separador em query strings - sempre codifique dentro de valores)
' 0x27 -> %27
( 0x28 -> %28
) 0x29 -> %29
+ 0x2B -> %2B (ou %20 em corpos de formulário; '+' significa espaço lá)
, 0x2C -> %2C
/ 0x2F -> %2F (reservado no path, normalmente seguro na query)
: 0x3A -> %3A
; 0x3B -> %3B
= 0x3D -> %3D
? 0x3F -> %3F
@ 0x40 -> %40
Exemplo: https://example.com/path with space and ampersand
Codificado: https://example.com/path%20with%20space%20%26%20ampersandEscapes de caracteres de controle e metacaracteres regex
Códigos de controle comuns e suas formas de escape em strings C / Python / JavaScript:
NUL 0x00 '\0' (terminador de string em C)
BEL 0x07 '\a' (sino do terminal)
BS 0x08 '\b' (backspace)
TAB 0x09 '\t' (tabulação horizontal)
LF 0x0A '\n' (nova linha)
VT 0x0B '\v' (tabulação vertical)
FF 0x0C '\f' (form feed)
CR 0x0D '\r' (retorno de carro)
ESC 0x1B '\x1b' / '\e' (POSIX) (início de sequência de escape)
DEL 0x7F '\x7f' (delete)
Metacaracteres regex que precisam ser escapados com \:
^ $ . | ? * + ( ) [ ] { } \
Trecho em JavaScript que reproduz a tabela acima:
const ctrl = { 0:'NUL', 9:'TAB', 10:'LF', 13:'CR', 27:'ESC', 32:'SP', 127:'DEL' };
for (const [code, name] of Object.entries(ctrl)) {
console.log(`${code.toString().padStart(3)} 0x${(+code).toString(16).padStart(2,'0')} ${name}`);
}
// -> ' 0x20 SP' 0a LF 0d CR etc.Perguntas frequentes
Qual o tamanho da tabela ASCII?
O ASCII padrão tem 128 pontos de código (0-127): 33 caracteres de controle (0-31 mais 127 DEL) e 95 caracteres imprimíveis (do espaço ao ~). 'ASCII estendido' refere-se a várias codificações de byte único com 256 pontos de código, como Windows-1252 ou ISO-8859-1, que na verdade não são ASCII.
Por que o caractere 32 aparece como 'Space' em vez de um glifo visível?
O ponto de código 32 (0x20) é o caractere literal de espaço. Ele é imprimível, mas invisível. A página mostra o rótulo 'SP' ou 'Space' para que você possa copiá-lo; clicando na linha, um caractere de espaço real é copiado para a área de transferência.
Para que servem os primeiros 32 códigos ASCII?
São caracteres de controle dos tempos do teleimpressor: TAB (9), LF (10), CR (13), ESC (27) e outros. Softwares modernos ainda usam TAB, LF, CR e NUL (0); o restante (BEL, ACK, ENQ etc.) é majoritariamente histórico e só aparece em protocolos seriais e cabeçalhos de arquivos binários.
ASCII é a mesma coisa que UTF-8?
ASCII é uma codificação de 7 bits para o inglês. UTF-8 é uma codificação de comprimento variável que é compatível byte a byte com ASCII para os primeiros 128 pontos de código — então qualquer arquivo puramente ASCII também é UTF-8 válido. UTF-8 estende com sequências de 2 a 4 bytes para cobrir o resto do Unicode.
Como converto entre decimal, hexadecimal e binário para um caractere?
Escolha uma linha para ver as quatro representações. Por exemplo, 'A' é decimal 65, hex 0x41, octal 0101, binário 01000001. A coluna Char é o glifo literal e a coluna Description traz o nome oficial Unicode.
Por que esta tabela não lista é, ñ ou 中?
Esses caracteres estão fora da faixa ASCII. é e ñ estão no Latin-1 (pontos de código 233 e 241); 中 está em CJK Unified Ideographs (U+4E2D). Use uma ferramenta de consulta Unicode para eles — o ASCII só vai até 127.
Como digito um caractere se só conheço o código ASCII dele?
No Windows, segure Alt e digite o código decimal no teclado numérico (Alt+65 para A). No macOS e Linux, cole desta tabela ou use o recurso de código hex do método de entrada. Em código, use \xNN (hex), \NNN (octal) ou chr(N) (Python) e String.fromCharCode(N) (JavaScript).