Convertisseur de jeu de caractères

Conversion professionnelle d'encodage avec détection automatique

Encodage source

Encodage cible

Options de conversion

Ajouter BOM (marqueur d'ordre des octets)

Supprimer BOM existant

Afficher hex

Format d'entrée

Format de sortie

Texte d'entrée

Caractères en entrée: 0 Octets en entrée: 0

Texte de sortie

Caractères en sortie: 0 Octets en sortie: 0

Sortie hexadécimale

🔒 100% Traitement localLes données que vous saisissez sont traitées entièrement dans votre navigateur et ne sont envoyées à aucun serveur.

Déposez les fichiers ici ou cliquez pour sélectionner

Plusieurs fichiers supportés (Les gros fichiers peuvent affecter les performances)

Encodage source

Détection auto ou sélection manuelle de l'encodage pour les fichiers téléchargés

Encodage cible

Fichiers sélectionnés

Nom du fichier	Taille	Encodage source	Aperçu	Statut

Documentation du convertisseur

Qu'est-ce que l'encodage de caractères ?

L'encodage de caractères est un système qui associe les caractères à des nombres (points de code) puis à des octets. Différents encodages utilisent différentes correspondances, c'est pourquoi le texte peut apparaître corrompu s'il est ouvert avec le mauvais encodage.

Guide d'utilisation

Mode conversion de texte

Cliquez sur l'onglet 'Conversion de texte' pour entrer en mode conversion de texte
Sélectionnez l'encodage source dans le menu déroulant, ou utilisez 'Détection auto' pour identifier automatiquement l'encodage
Sélectionnez l'encodage cible (par défaut UTF-8, l'encodage le plus universel)
Choisissez le format d'entrée/sortie : Texte brut, Base64, Hex, ou format tableau C/C++
Entrez ou collez votre texte, puis cliquez sur 'Convertir'. Utilisez 'Copier' pour copier le résultat ou 'Télécharger' pour sauvegarder

Mode conversion de fichiers

Cliquez sur l'onglet 'Conversion de fichiers' pour entrer en mode fichier
Glissez-déposez les fichiers dans la zone ou cliquez pour sélectionner (plusieurs fichiers supportés)
Le système détecte automatiquement l'encodage de chaque fichier, affiché dans la colonne 'Encodage source'. Vous pouvez modifier manuellement si nécessaire
Sélectionnez l'encodage cible pour tous les fichiers
Cliquez sur 'Tout convertir' pour convertir, puis 'Tout télécharger' pour sauvegarder les fichiers convertis

Formats d'entrée/sortie supportés

Texte brut - Contenu texte normal, entrée directe ou collé
Base64 - Chaîne encodée en Base64, couramment utilisée dans les pièces jointes email et URLs de données
Hex - Octets hexadécimaux continus, ex: 48656C6C6F
Hex avec espaces - Octets hexadécimaux séparés par des espaces, ex: 48 65 6C 6C 6F
Tableau C/C++ - Format tableau d'octets style C/C++, ex: 0x48,0x65,0x6C,0x6C,0x6F

Cas d'utilisation courants

Corriger le texte corrompu

Lorsque vous recevez des fichiers texte ou emails corrompus, utilisez cet outil pour convertir de l'encodage original vers le bon pour restaurer le contenu lisible.

Migration de base de données

Lors de la migration de données entre différents systèmes de base de données ou serveurs, utilisez cet outil pour assurer la cohérence de l'encodage et prévenir la corruption.

Développement web

Convertissez les pages web héritées en encodage UTF-8 pour assurer un affichage correct sur les navigateurs modernes et différentes plateformes.

Partage de fichiers multiplateforme

Convertissez les fichiers entre systèmes Windows (GBK), macOS et Linux pour assurer un affichage correct du texte sur toutes les plateformes.

Conseils

Utilisez la détection auto si vous n'êtes pas sûr de l'encodage source
Activez la vue hex pour voir les valeurs d'octets réelles
Ajoutez BOM pour les fichiers UTF-8/UTF-16 utilisés sur Windows
Pour la conversion par lots, utilisez l'onglet Fichiers
Lors de la conversion entre encodages, certains caractères peuvent ne pas exister dans l'encodage cible et seront remplacés par '?' ou similaire

Référence des encodages supportés

Cet outil prend en charge plus de 30 encodages de caractères couvrant les principales langues et régions du monde. Voici une référence détaillée pour chaque encodage supporté.

Encodages Unicode

Encodage	Description	Plage d'octets	Spécification
UTF-8	Encodage Unicode à longueur variable, le plus utilisé sur le web. Rétrocompatible avec ASCII.	1-4 bytes	RFC 3629
UTF-16 LE	UTF-16 Little Endian, couramment utilisé sur les systèmes Windows. Utilise 2 ou 4 octets par caractère.	2/4 bytes	RFC 2781
UTF-16 BE	UTF-16 Big Endian, utilisé dans certains protocoles réseau et Java. Utilise 2 ou 4 octets par caractère.	2/4 bytes	RFC 2781

Encodages chinois

Encodage	Description	Utilisation	Spécification
GBK	Extension de GB2312, supporte 21 003 caractères chinois incluant les caractères traditionnels. Courant sur Windows en chinois simplifié.	Windows chinois simplifié, anciens sites web	IANA GBK
GB2312	Norme nationale chinoise originale (1980), supporte 6 763 caractères chinois simplifiés et 682 symboles.	Systèmes hérités, emails	GB 2312-1980
GB18030	Dernière norme nationale chinoise, obligatoire en Chine. Supporte tous les caractères Unicode incluant les langues minoritaires.	Systèmes chinois modernes, documents officiels	GB 18030-2005
Big5	Encodage chinois traditionnel, principalement utilisé à Taïwan et Hong Kong. Contient 13 060 caractères traditionnels.	Sites web de Taïwan, Hong Kong	IANA Charset

Encodages japonais

Encodage	Description	Utilisation	Spécification
Shift_JIS	Encodage japonais de Microsoft, supporte les jeux de caractères JIS X 0201 et JIS X 0208.	Windows, anciens sites web, jeux vidéo	IANA Charset
EUC-JP	Extended Unix Code pour le japonais, encodage à longueur variable compatible avec ASCII.	Systèmes Unix/Linux, anciens sites web	IANA Charset
ISO-2022-JP	Encodage japonais 7 bits utilisant des séquences d'échappement. Aussi appelé encodage JIS.	Emails japonais, anciens systèmes	RFC 1468

Encodages coréens

Encodage	Description	Utilisation	Spécification
EUC-KR	Extended Unix Code pour le coréen, basé sur la norme KS X 1001. Supporte 8 822 caractères coréens (Hangul + Hanja).	Sites web coréens, systèmes hérités	RFC 1557

Encodages d'Europe occidentale

Encodage	Description	Langues	Spécification
ISO-8859-1	Aussi connu sous le nom Latin-1, première partie de la série ISO-8859. Couvre 191 caractères des langues d'Europe occidentale.	Anglais, français, allemand, espagnol, portugais, italien	ISO/IEC 8859-1
ISO-8859-15	Latin-9, met à jour Latin-1 avec le signe Euro (€) et des caractères français/finnois supplémentaires.	Langues d'Europe occidentale avec symbole Euro	ISO/IEC 8859-15
Windows-1252	Extension de Microsoft à Latin-1, ajoute des caractères typographiques comme les guillemets et tirets.	Langues d'Europe occidentale sous Windows	Unicode.org

Encodages cyrilliques

Encodage	Description	Langues	Spécification
Windows-1251	Encodage cyrillique de Microsoft pour Windows, supporte le russe et autres langues à base cyrillique.	Russe, ukrainien, bulgare, serbe	Unicode.org
KOI8-R	Encodage cyrillique 8 bits, conçu pour le russe. Les caractères restent lisibles même si le bit de poids fort est supprimé.	Russe	RFC 1489
ISO-8859-5	Encodage cyrillique standard ISO, fait partie de la série ISO-8859. Supporte les caractères cyrilliques de base.	Russe, bulgare, macédonien, serbe	ISO/IEC 8859-5

Autres encodages

Encodage	Description	Utilisation	Spécification
ASCII	American Standard Code for Information Interchange, la base de la plupart des encodages modernes. Encodage 7 bits avec 128 caractères.	Texte anglais de base, programmation	RFC 20
Macintosh	Encodage de caractères original d'Apple pour Mac OS Classic, aussi connu sous le nom Mac Roman.	Anciens fichiers Mac, anciennes applications Mac	Unicode.org

Questions fréquentes

Qu'est-ce qu'un encodage de caractères et pourquoi est-il important ?

Un encodage de caractères est une correspondance entre des caractères (lettres, symboles, chiffres) et des valeurs d'octets numériques. Un ordinateur stocke le texte sous forme de nombres, et l'encodage lui indique quel nombre représente quel caractère. Lorsque l'émetteur et le récepteur utilisent des encodages différents, les octets sont mal interprétés et le texte apparaît corrompu — un problème parfois appelé mojibake. UTF-8 est la norme du Web et prend en charge pratiquement toutes les langues.

Quelle est la différence entre GBK, GB2312 et GB18030 ?

Ces trois encodages sont des normes nationales chinoises. GB2312 (1981) couvre 6 763 caractères chinois simplifiés. GBK (1993) est un sur-ensemble de GB2312 et ajoute environ 21 000 caractères, dont les caractères traditionnels. GB18030 (2005) est la norme nationale obligatoire actuelle qui inclut tous les caractères Unicode, ce qui en fait la plus complète des trois.

Pourquoi mon texte converti est-il encore illisible ?

Un texte encore corrompu après conversion indique généralement que le mauvais encodage source a été sélectionné. Si le fichier d'origine était enregistré en GBK mais que vous avez choisi UTF-8 comme source, les octets seront mal interprétés. Essayez différents encodages sources — les plus courants pour les langues asiatiques sont GBK, Shift-JIS, EUC-KR et Big5. Pour les textes européens, essayez Windows-1252 ou ISO-8859-1.

Qu'est-ce que Shift-JIS et quand est-il utilisé ?

Shift-JIS est un encodage de caractères japonais développé dans les années 1980. Il était utilisé par Microsoft Windows et de nombreuses anciennes applications et sites web japonais. Les systèmes modernes préfèrent UTF-8, mais Shift-JIS est encore présent dans les bases de données héritées, les systèmes embarqués et les vieilles ROMs de jeux.

Peut-on convertir entre UTF-8 et UTF-16 ?

Oui. UTF-8 et UTF-16 encodent les mêmes points de code Unicode — ce sont simplement des représentations en octets différentes des mêmes caractères. UTF-8 utilise 1 à 4 octets par caractère et est compact pour le texte ASCII. UTF-16 utilise 2 ou 4 octets par caractère et est utilisé en interne par Windows, Java et les moteurs JavaScript. La conversion entre eux ne change que la représentation en octets, pas les caractères.

Outils Connexes

Convertisseur d'Encodage

Convertir du texte entre Hex, Binaire, Unicode, ASCII, Base64 et de nombreux autres formats d'encodage

Encodeur/Décodeur Base64

Encodez et décodez rapidement des chaînes Base64, prenant en charge la conversion de texte et de fichiers

Encodeur/Décodeur URL

Encodez et décodez les URL pour assurer la conformité et la facilité d'utilisation

Encodeur/Décodeur HTML

Convertir les caractères spéciaux en entités HTML avec formats nommés, décimaux et hexadécimaux pour prévenir les attaques XSS