CoderTools

Convertidor de Codificación de Texto

Convierte texto entre Hex, Binario, Unicode y más formatos de codificación

Delimitador de bytes:
Agregar prefijo:

Documentación del Convertidor de Codificación

¿Qué es la codificación de caracteres?

La codificación de caracteres es un sistema que mapea caracteres a números que las computadoras pueden procesar. Diferentes esquemas de codificación se usan para diferentes propósitos como almacenar, transmitir o mostrar datos de texto. Las codificaciones comunes incluyen ASCII, UTF-8, UTF-16, etc.

Formatos soportados

Hexadecimal (Hex)

Representación hexadecimal usando dígitos 0-9 y letras A-F. Cada byte se representa con dos caracteres hex. Ampliamente usado en programación y depuración.

Binario

Representación binaria usando solo 0 y 1. Cada byte se representa con 8 bits. Esta es la representación fundamental de datos usada por las computadoras.

Escape Unicode

Secuencias de escape Unicode en formato \uXXXX, comúnmente usadas en lenguajes de programación como JavaScript y JSON para representar caracteres Unicode.

Entidad HTML

Codificación de entidades HTML, incluyendo entidades con nombre (como &) y entidades numéricas (como & o &). Usado para mostrar caracteres especiales de forma segura en HTML.

Punycode

Esquema de codificación para Nombres de Dominio Internacionalizados (IDN). Convierte caracteres Unicode a codificación compatible con ASCII, con prefijo xn--.

Casos de uso comunes

  • Ver representación hexadecimal o binaria de caracteres durante la depuración
  • Manejar codificación de datos en protocolos de red
  • Analizar y corregir problemas de codificación (mojibake)
  • Usar secuencias de escape Unicode en código
  • Manejar Nombres de Dominio Internacionalizados (IDN)
  • Escape de caracteres en HTML/XML

Conjunto de caracteres vs Formato de codificación

El conjunto de caracteres y el formato de codificación son dos conceptos diferentes. Un conjunto de caracteres define qué caracteres se usan en el texto (como ASCII, GB2312, GBK, Unicode, etc.), mientras que un formato de codificación define cómo se almacenan estos caracteres en una computadora (como UTF-8, UTF-16, etc.). Por ejemplo, el mismo texto puede codificarse con el conjunto de caracteres GB2312 como codificación GB2312, o con el conjunto de caracteres Unicode como UTF-8.

Si necesita convertir entre diferentes conjuntos de caracteres (como GBK, UTF-8, ISO-8859-1, etc.) en lugar de simplemente cambiar el formato de codificación, use la herramienta Convertidor de conjunto de caracteres.

Preguntas frecuentes

¿Cuál es la diferencia entre codificación y cifrado?

La codificación transforma datos en otra representación usando un esquema conocido públicamente — no se necesita clave secreta y cualquiera puede invertir el proceso. El cifrado mezcla datos usando una clave secreta, solo quien tiene la clave puede revertirlo. Base64 y hexadecimal son codificaciones; AES y RSA son algoritmos de cifrado.

¿Por qué el texto codificado en Base64 termina con = o ==?

Base64 codifica cada 3 bytes de entrada en 4 caracteres de salida. Cuando la longitud de la entrada no es divisible por 3, se añade uno o dos caracteres = como relleno para que la salida sea múltiplo de 4. Un = indica 1 byte de relleno agregado; dos == indican 2 bytes. Algunas implementaciones omiten el relleno — ambas formas son válidas si el decodificador lo maneja.

¿Cuál es la diferencia entre ASCII y Unicode?

ASCII es una codificación de 7 bits que cubre 128 caracteres (A-Z, 0-9, puntuación común). Unicode es un estándar de repertorio de caracteres que cubre más de 140,000 caracteres en todos los sistemas de escritura. UTF-8, UTF-16 y UTF-32 son distintas formas de codificar puntos de código Unicode como bytes — UTF-8 es compatible hacia atrás con ASCII para los primeros 128 puntos de código.

¿Cuándo debo usar codificación hexadecimal en lugar de Base64?

El hexadecimal (Base16) representa cada byte como dos caracteres hexadecimales, es más largo pero inmediatamente legible para inspección técnica — útil para depurar flujos de bytes, claves criptográficas y valores de protocolos binarios. Base64 es alrededor de un 33% más compacto y se prefiere para transmitir datos binarios en JSON, correos electrónicos o URLs.

¿Qué significa la notación U+XXXX para puntos de código Unicode?

U+XXXX es la notación estándar para un punto de código Unicode, donde XXXX es un número hexadecimal. Por ejemplo, U+0041 es la letra mayúscula A en latín, y U+4E2D es el carácter chino 中. Los puntos de código van de U+0000 a U+10FFFF. El prefijo U+ fue introducido por el Consorcio Unicode para distinguir los puntos de código de los valores de bytes.

Herramientas Relacionadas

Menú Rápido

Sin herramientas recientes