
Decodificador UTF-8
El Decodificador UTF-8 de Qodex le permite convertir cadenas hexadecimales codificadas en UTF-8 de vuelta a texto legible. Esta herramienta es especialmente útil para depurar registros codificados, analizar paquetes de comunicación e interpretar datos binarios.
Para codificar texto legible en hex UTF-8, pruebe nuestro Codificador UTF-8. También puede explorar nuestro Decodificador Base64 y el Decodificador de URL si sus datos están codificados de otra manera.
Decodificador UTF-8 - Documentación
¿Qué es la Decodificación UTF-8?
La decodificación UTF-8 es el proceso de convertir una secuencia de bytes hexadecimales (codificados con UTF-8) de vuelta a texto legible para humanos.
UTF-8 (Unicode Transformation Format - 8 bits) es el formato de codificación de caracteres más ampliamente utilizado en la web. Cada símbolo, letra, emoji o número en UTF-8 tiene una representación binaria o hexadecimal única.
El Decodificador UTF-8 de Qodex le ayuda a revertir esta codificación: pegando una cadena hexadecimal UTF-8 como 48 65 6c 6c 6f, verá la versión legible: Hello.
¿Cómo Funciona la Decodificación UTF-8?
UTF-8 es un formato de codificación binaria de longitud variable usado para representar texto en sistemas digitales. Cada carácter, ya sea una simple letra como A o un símbolo especial como ✓, tiene un punto de código Unicode correspondiente que se codifica en bytes usando las reglas de UTF-8.
Paso a Paso:
Proporcione una secuencia de bytes hexadecimales (como
48 65 6C 6C 6F)Cada par de caracteres hexadecimales representa 1 byte (8 bits)
El decodificador convierte hex a binario, agrupa los bytes según las reglas UTF-8 y los mapea a sus caracteres Unicode correspondientes
Obtiene la salida decodificada como texto legible
Ejemplo:
Hex: 48 65 6C 6C 6F
Binary: 01001000 01100101 01101100 01101100 01101111
UTF-8 Mapping: ['H', 'e', 'l', 'l', 'o']
Output: HelloUTF-8 es de longitud variable:
Caracteres ASCII = 1 byte
Símbolos latinos/griegos = 2 bytes
La mayoría de los caracteres CJK = 3 bytes
Emojis y scripts raros = 4 bytes
Tabla de Referencia de Decodificación UTF-8
Use esta referencia para identificar rápidamente secuencias hexadecimales UTF-8 comunes y sus caracteres decodificados:
Carácter | Descripción | Punto de Código | Hex UTF-8 | Bytes |
|---|---|---|---|---|
A | Letra mayúscula latina A | U+0041 | 41 | 1 |
a | Letra minúscula latina a | U+0061 | 61 | 1 |
0 | Dígito cero | U+0030 | 30 | 1 |
(espacio) | Carácter de espacio | U+0020 | 20 | 1 |
© | Signo de copyright | U+00A9 | C2 A9 | 2 |
é | Letra e minúscula con acento agudo | U+00E9 | C3 A9 | 2 |
ü | Letra u minúscula con diéresis | U+00FC | C3 BC | 2 |
€ | Signo del euro | U+20AC | E2 82 AC | 3 |
✓ | Marca de verificación | U+2713 | E2 9C 93 | 3 |
✔ | Marca de verificación gruesa | U+2714 | E2 9C 94 | 3 |
中 | CJK "medio" | U+4E2D | E4 B8 AD | 3 |
𝄞 | Símbolo musical clave de Sol | U+1D11E | F0 9D 84 9E | 4 |
🚀 | Emoji cohete | U+1F680 | F0 9F 9A 80 | 4 |
Reglas de Estructura de Bytes UTF-8
Cantidad de Bytes | Byte 1 | Byte 2 | Byte 3 | Byte 4 |
|---|---|---|---|---|
1 byte (ASCII) | 0xxxxxxx | - | - | - |
2 bytes | 110xxxxx | 10xxxxxx | - | - |
3 bytes | 1110xxxx | 10xxxxxx | 10xxxxxx | - |
4 bytes | 11110xxx | 10xxxxxx | 10xxxxxx | 10xxxxxx |
Cada x representa un bit del punto de código Unicode del carácter. Los bits iniciales del primer byte indican cuántos bytes forman la secuencia.
Ejemplos Prácticos del Mundo Real
Decodificación de Encabezados de Correo Electrónico Codificados
Muchos encabezados de correo electrónico están codificados en UTF-8 para una transmisión segura. Extraiga el hex y péguelo aquí para decodificar la línea de asunto real.Hex Input: 53 75 62 6a 65 63 74 3a 20 57 65 6c 63 6f 6d 65 21 Decoded: Subject: Welcome!Análisis de Registros de Dispositivos IoT o APIs
Los dispositivos suelen almacenar mensajes de texto o alertas en formato hexadecimal.Hex Input: 41 6c 65 72 74 3a 20 e2 9c 94 Decoded: Alert: ✔Decodificación de Firmas de Malware o Datos de Paquetes
Los analistas de seguridad examinan volcados de memoria o archivos pcap donde las cadenas se almacenan en forma hexadecimal.
Hex: 55 73 65 72 3a 20 61 64 6d 69 6e Output: User: admin
Decodificación UTF-8 en Múltiples Lenguajes de Programación
¿Necesita decodificar UTF-8 en código? Aquí encontrará ejemplos listos para producción en los lenguajes más populares:
Python: bytes.decode('utf-8')
# Decode UTF-8 bytes to string encoded = b'\xc3\xa9\xc3\xa0\xc3\xbc' decoded = encoded.decode('utf-8') print(decoded) # Output: eaue with accentsDecode hex string to text
hex_string = "48 65 6c 6c 6f" byte_data = bytes.fromhex(hex_string.replace(" ", "")) text = byte_data.decode('utf-8') print(text) # Output: Hello
Handle errors gracefully
bad_bytes = b'\xff\xfe' safe = bad_bytes.decode('utf-8', errors='replace') print(safe) # Output: (replacement characters)
JavaScript: TextDecoder
// Decode a Uint8Array of UTF-8 bytes const decoder = new TextDecoder('utf-8'); const bytes = new Uint8Array([0x48, 0x65, 0x6C, 0x6C, 0x6F]); console.log(decoder.decode(bytes)); // Output: Hello// Decode hex string to text function hexToUtf8(hex) { const bytes = hex.split(' ').map(h => parseInt(h, 16)); return new TextDecoder('utf-8').decode(new Uint8Array(bytes)); } console.log(hexToUtf8('E2 9C 94')); // Output: ✔
// Handling streaming data const stream = new TextDecoderStream('utf-8'); // Pipe a ReadableStream of bytes through it
PHP: mb_detect_encoding() y conversión hexadecimal
// Decode hex to UTF-8 string $hex = "48 65 6c 6c 6f"; $bytes = hex2bin(str_replace(' ', '', $hex)); echo $bytes; // Output: Hello// Detect if a string is valid UTF-8 $text = "Caf\xc3\xa9"; if (mb_detect_encoding($text, 'UTF-8', true)) { echo "Valid UTF-8"; } else { echo "Not valid UTF-8"; }
// Convert from other encodings to UTF-8 $iso_text = mb_convert_encoding($text, 'UTF-8', 'ISO-8859-1');
Java: new String(bytes, StandardCharsets.UTF_8)
import java.nio.charset.StandardCharsets;// Decode byte array to string byte[] utf8Bytes = {0x48, 0x65, 0x6C, 0x6C, 0x6F}; String decoded = new String(utf8Bytes, StandardCharsets.UTF_8); System.out.println(decoded); // Output: Hello
// Decode hex string String hex = "E2 9C 94"; String[] hexParts = hex.split(" "); byte[] bytes = new byte[hexParts.length]; for (int i = 0; i < hexParts.length; i++) { bytes[i] = (byte) Integer.parseInt(hexParts[i], 16); } System.out.println(new String(bytes, StandardCharsets.UTF_8)); // ✔
Cómo Funciona Esta Herramienta
Pegue la cadena hexadecimal UTF-8 (por ejemplo,
48 65 6c 6c 6f) en el campo de entrada.Haga clic en Decodificar.
La herramienta convierte al instante los bytes en texto legible como Hello.
Toda la decodificación ocurre del lado del cliente en su navegador. Ningún dato se envía a ningún servidor, lo que la hace completamente segura para datos sensibles.
Características de la Herramienta
Decodifique hex UTF-8 a texto plano
Acepta hex con o sin espacios (
E2 9C 94oE29C94)Decodificación instantánea del lado del cliente, segura y lista para uso sin conexión
Maneja caracteres multibyte, emojis y scripts internacionales
Útil para depurar APIs codificadas, campos de bases de datos, registros o muestras de malware
Casos de Uso
Seguridad y Forense: Decodifique payloads hexadecimales en capturas de paquetes o volcados de memoria
Recuperación de Bases de Datos: Corrija UTF-8 malformado en registros corruptos
Depuración de Programas: Interprete respuestas de API o registros con texto codificado
Desarrollo Web: Decodifique caracteres codificados en HTML, CSS o URLs
QA de Localización: Verifique la codificación sin procesar de texto multilingüe
Combínelo con Estas Herramientas
Codificador UTF-8: convierta texto en bytes UTF-8 con formato hexadecimal
Decodificador Base64: decodifique cadenas base64 en hex sin procesar antes de la decodificación UTF-8
Decodificador de URL: decodifique %E2%9C%94 y otras secuencias seguras para URL
Consejos Profesionales
Si su texto contiene
%E2%9C%94, primero use un Decodificador de URL y luego esta herramienta.Los emojis y caracteres en idiomas extranjeros suelen usar secuencias UTF-8 de 3 a 4 bytes.
Tenga cuidado con las secuencias de bytes inválidas; si el decodificador falla, verifique el espaciado o los datos corruptos.
Use este decodificador para entender cómo su aplicación o navegador procesa datos UTF-8 en segundo plano.
Al depurar mojibake, intente primero decodificar el texto desordenado como Latin-1 y luego recodificarlo como UTF-8.
Frequently Asked Questions
¿Qué ocurre si ingreso bytes UTF-8 inválidos?
¿Puedo usar esto para codificaciones distintas de UTF-8 como ISO-8859-1?
¿Es seguro usar esto para datos sensibles?
¿Por qué algunos caracteres se muestran como carácter de reemplazo?
¿Puedo decodificar emojis o caracteres en idiomas distintos al inglés?
¿Qué causa el mojibake y cómo lo corrijo?
¿Cómo detecto si una cadena está codificada en UTF-8?
¿Cuál es la diferencia entre UTF-8 y UTF-16?
Related Tools
Related Articles

¡Pruebe sus APIs hoy!
Escriba en español sencillo y Qodex lo convierte en pruebas seguras y listas para ejecutar.



