
Decodificador UTF-8
O Decodificador UTF-8 do Qodex permite converter strings hex codificadas em UTF-8 de volta para texto legível. Esta ferramenta é especialmente útil para depurar logs codificados, analisar pacotes de comunicação e interpretar dados binários.
Para codificar texto legível em hex UTF-8, experimente nosso Codificador UTF-8. Você também pode explorar nosso Decodificador Base64 e Decodificador de URL se seus dados estiverem codificados de forma diferente.
Decodificador UTF-8 - Documentação
O que é Decodificação UTF-8?
A decodificação UTF-8 é o processo de converter uma sequência de bytes hexadecimais (codificados usando UTF-8) de volta para texto legível por humanos.
UTF-8 (Unicode Transformation Format - 8 bit) é o formato de codificação de caracteres mais amplamente usado na web. Todo símbolo, letra, emoji ou número em UTF-8 tem uma representação binária ou hex única.
O Decodificador UTF-8 do Qodex ajuda você a reverter essa codificação: colando uma string hex UTF-8 como 48 65 6c 6c 6f, você verá a versão legível: Hello.
Como Funciona a Decodificação UTF-8?
UTF-8 é um formato de codificação binária de comprimento variável usado para representar texto em sistemas digitais. Cada caractere, seja uma letra simples como A ou um símbolo especial como ✓, tem um ponto de código Unicode correspondente, que é codificado em bytes usando as regras UTF-8.
Passo a Passo:
Você fornece uma sequência de bytes hex (como
48 65 6C 6C 6F)Cada par de caracteres hex representa 1 byte (8 bits)
O decodificador converte hex para binário, agrupa os bytes de acordo com as regras UTF-8 e os mapeia para seus caracteres Unicode correspondentes
Você obtém a saída decodificada como texto legível
Exemplo:
Hex: 48 65 6C 6C 6F
Binary: 01001000 01100101 01101100 01101100 01101111
UTF-8 Mapping: ['H', 'e', 'l', 'l', 'o']
Output: HelloUTF-8 é de comprimento variável:
Caracteres ASCII = 1 byte
Símbolos latino/grego = 2 bytes
A maioria dos caracteres CJK = 3 bytes
Emojis e scripts raros = 4 bytes
Tabela de Referência de Decodificação UTF-8
Use esta referência para identificar rapidamente sequências hex UTF-8 comuns e seus caracteres decodificados:
Caractere | Descrição | Ponto de Código | Hex UTF-8 | Bytes |
|---|---|---|---|---|
A | A maiúsculo latino | U+0041 | 41 | 1 |
a | a minúsculo latino | U+0061 | 61 | 1 |
0 | Dígito zero | U+0030 | 30 | 1 |
(espaço) | Caractere de espaço | U+0020 | 20 | 1 |
© | Símbolo de copyright | U+00A9 | C2 A9 | 2 |
é | e minúsculo com acento agudo | U+00E9 | C3 A9 | 2 |
ü | u minúsculo com trema | U+00FC | C3 BC | 2 |
€ | Símbolo do euro | U+20AC | E2 82 AC | 3 |
✓ | Marca de verificação | U+2713 | E2 9C 93 | 3 |
✔ | Marca de verificação pesada | U+2714 | E2 9C 94 | 3 |
中 | CJK "meio" | U+4E2D | E4 B8 AD | 3 |
𝄞 | Símbolo musical clave de sol | U+1D11E | F0 9D 84 9E | 4 |
🚀 | Emoji de foguete | U+1F680 | F0 9F 9A 80 | 4 |
Regras de Estrutura de Bytes UTF-8
Qtd. Bytes | Byte 1 | Byte 2 | Byte 3 | Byte 4 |
|---|---|---|---|---|
1 byte (ASCII) | 0xxxxxxx | - | - | - |
2 bytes | 110xxxxx | 10xxxxxx | - | - |
3 bytes | 1110xxxx | 10xxxxxx | 10xxxxxx | - |
4 bytes | 11110xxx | 10xxxxxx | 10xxxxxx | 10xxxxxx |
Cada x representa um bit do ponto de código Unicode do caractere. Os bits iniciais do primeiro byte indicam quantos bytes compõem a sequência.
Exemplos Práticos do Mundo Real
Decodificando Cabeçalhos de Email Codificados
Muitos cabeçalhos de email são codificados em UTF-8 para transmissão segura. Extraia o hex e cole aqui para decodificar a linha de assunto real.Hex Input: 53 75 62 6a 65 63 74 3a 20 57 65 6c 63 6f 6d 65 21 Decoded: Subject: Welcome!Analisando Logs de Dispositivos IoT ou APIs
Dispositivos frequentemente armazenam mensagens de texto ou alertas em formato hex.Hex Input: 41 6c 65 72 74 3a 20 e2 9c 94 Decoded: Alert: ✔Decodificando Assinaturas de Malware ou Dados de Pacotes
Analistas de segurança examinam dumps de memória ou arquivos pcap onde strings são armazenadas em formato hex.
Hex: 55 73 65 72 3a 20 61 64 6d 69 6e Output: User: admin
Decodificação UTF-8 em Múltiplas Linguagens de Programação
Precisa decodificar UTF-8 em código? Aqui estão exemplos prontos para produção nas linguagens mais populares:
Python: bytes.decode('utf-8')
# Decode UTF-8 bytes to string encoded = b'\xc3\xa9\xc3\xa0\xc3\xbc' decoded = encoded.decode('utf-8') print(decoded) # Output: eaue with accentsDecode hex string to text
hex_string = "48 65 6c 6c 6f" byte_data = bytes.fromhex(hex_string.replace(" ", "")) text = byte_data.decode('utf-8') print(text) # Output: Hello
Handle errors gracefully
bad_bytes = b'\xff\xfe' safe = bad_bytes.decode('utf-8', errors='replace') print(safe) # Output: (replacement characters)
JavaScript: TextDecoder
// Decode a Uint8Array of UTF-8 bytes const decoder = new TextDecoder('utf-8'); const bytes = new Uint8Array([0x48, 0x65, 0x6C, 0x6C, 0x6F]); console.log(decoder.decode(bytes)); // Output: Hello// Decode hex string to text function hexToUtf8(hex) { const bytes = hex.split(' ').map(h => parseInt(h, 16)); return new TextDecoder('utf-8').decode(new Uint8Array(bytes)); } console.log(hexToUtf8('E2 9C 94')); // Output: ✔
// Handling streaming data const stream = new TextDecoderStream('utf-8'); // Pipe a ReadableStream of bytes through it
PHP: mb_detect_encoding() e conversão hex
// Decode hex to UTF-8 string $hex = "48 65 6c 6c 6f"; $bytes = hex2bin(str_replace(' ', '', $hex)); echo $bytes; // Output: Hello// Detect if a string is valid UTF-8 $text = "Caf\xc3\xa9"; if (mb_detect_encoding($text, 'UTF-8', true)) { echo "Valid UTF-8"; } else { echo "Not valid UTF-8"; }
// Convert from other encodings to UTF-8 $iso_text = mb_convert_encoding($text, 'UTF-8', 'ISO-8859-1');
Java: new String(bytes, StandardCharsets.UTF_8)
import java.nio.charset.StandardCharsets;// Decode byte array to string byte[] utf8Bytes = {0x48, 0x65, 0x6C, 0x6C, 0x6F}; String decoded = new String(utf8Bytes, StandardCharsets.UTF_8); System.out.println(decoded); // Output: Hello
// Decode hex string String hex = "E2 9C 94"; String[] hexParts = hex.split(" "); byte[] bytes = new byte[hexParts.length]; for (int i = 0; i < hexParts.length; i++) { bytes[i] = (byte) Integer.parseInt(hexParts[i], 16); } System.out.println(new String(bytes, StandardCharsets.UTF_8)); // ✔
Como Esta Ferramenta Funciona
Cole a String Hex UTF-8 (por exemplo,
48 65 6c 6c 6f) na caixa de entrada.Clique em Decodificar.
A ferramenta converte instantaneamente os bytes em texto legível como Hello.
Toda a decodificação acontece no lado do cliente no seu navegador. Nenhum dado é enviado a qualquer servidor, tornando-o completamente seguro para dados sensíveis.
Funcionalidades da Ferramenta
Decodifique hex UTF-8 para texto simples
Aceita hex com e sem espaços (
E2 9C 94ouE29C94)Decodificação instantânea no lado do cliente, segura e pronta para uso offline
Suporta caracteres multibyte, emojis e scripts internacionais
Útil para depurar APIs codificadas, campos de banco de dados, logs ou amostras de malware
Casos de Uso
Segurança e Forense: Decodifique payloads hex em capturas de pacotes ou dumps de memória
Recuperação de Banco de Dados: Corrija UTF-8 malformado em registros corrompidos
Depuração de Programação: Interprete respostas de API ou logs com texto codificado
Desenvolvimento Web: Decodifique caracteres codificados em HTML, CSS ou URLs
QA de Localização: Verifique a codificação bruta de texto multilíngue
Combine com Estas Ferramentas
Codificador UTF-8 -- converta texto em bytes UTF-8 em formato hex
Decodificador Base64 -- decodifique strings base64 em hex bruto antes da decodificação UTF-8
Decodificador de URL -- decodifique %E2%9C%94 e outras sequências seguras para URL
Dicas Profissionais
Se seu texto contém
%E2%9C%94, primeiro use um Decodificador de URL e depois use esta ferramenta.Emojis e caracteres de línguas estrangeiras geralmente usam sequências UTF-8 de 3 a 4 bytes.
Fique atento a sequências de bytes inválidas. Se o decodificador falhar, verifique os espaçamentos ou dados corrompidos.
Use este decodificador para entender como seu aplicativo ou navegador processa dados UTF-8 nos bastidores.
Ao depurar mojibake, tente decodificar o texto ilegível como Latin-1 primeiro, depois recodifique como UTF-8.
Frequently Asked Questions
O que acontece se eu inserir bytes UTF-8 inválidos?
Posso usar isso para codificações não UTF-8 como ISO-8859-1?
É seguro usar para dados sensíveis?
Por que alguns caracteres aparecem como caractere de substituição?
Posso decodificar emojis ou caracteres não latinos?
O que causa mojibake e como corrijo?
Como detectar se uma string está codificada em UTF-8?
Qual é a diferença entre UTF-8 e UTF-16?
Related Tools
Related Articles

Teste suas APIs hoje!
Escreva em português simples, o Qodex transforma em testes seguros e prontos para rodar.



