テキストエンコーディング変換ツール
16進数、2進数、Unicodeなど様々なエンコーディング形式間でテキストを変換
文字の詳細
エンコーディング変換ドキュメント
文字エンコーディングとは?
文字エンコーディングは、文字をコンピュータが処理できる数値にマッピングするシステムです。異なるエンコーディング方式は、テキストデータの保存、転送、表示など、異なる目的に使用されます。一般的なエンコーディングにはASCII、UTF-8、UTF-16などがあります。
サポートされている形式
16進数 (Hex)
0-9とA-Fを使用する16進数表現。各バイトは2つの16進文字で表されます。プログラミングやデバッグで広く使用されています。
2進数 (Binary)
0と1のみを使用する2進数表現。各バイトは8ビットで表されます。これはコンピュータの基本的なデータ表現方法です。
Unicodeエスケープ
\uXXXX形式のUnicodeエスケープシーケンス。JavaScriptやJSONなどのプログラミング言語でUnicode文字を表現するために一般的に使用されます。
HTMLエンティティ
HTMLエンティティエンコーディング。名前付きエンティティ(&など)と数値エンティティ(&や&など)を含みます。HTMLで特殊文字を安全に表示するために使用されます。
Punycode
国際化ドメイン名(IDN)のエンコーディング方式。Unicode文字をxn--で始まるASCII互換エンコーディングに変換します。
一般的な使用例
- デバッグ中に文字の16進数または2進数表現を確認
- ネットワークプロトコルでのデータエンコーディング処理
- 文字化け問題の分析と修正
- コードでUnicodeエスケープシーケンスを使用
- 国際化ドメイン名(IDN)の処理
- HTML/XMLでの文字エスケープ
文字セット vs エンコーディング形式
文字セットとエンコーディング形式は2つの異なる概念です。文字セットはテキストで使用される文字を定義し(ASCII、GB2312、GBK、Unicodeなど)、エンコーディング形式はこれらの文字がコンピュータにどのように格納されるかを定義します(UTF-8、UTF-16など)。たとえば、同じテキストはGB2312文字セットをGB2312エンコーディングとしてエンコードすることも、Unicode文字セットをUTF-8としてエンコードすることもできます。
GBK、UTF-8、ISO-8859-1など、異なる文字セット間で変換する必要があり、エンコーディング形式を変更するだけではない場合は、文字セット変換ツールを使用してください。
関連ツール
文字セットコンバーター
UTF-8、GBK、Big5、Shift_JIS、ISO-8859、Windowsコードページなどの文字セットエンコーディングを自動検出で変換
進数変換ツール
2進数、8進数、10進数、16進数間の変換、2-36の任意の基数をサポート
URLエンコーダ/デコーダ
コンプライアンスと使いやすさを確保するためのURLエンコード/デコード
HTMLエンコーダー/デコーダー
特殊文字をHTML実体に変換、名前付き・10進数・16進数形式をサポート、XSS攻撃を防止
Base64エンコーダ/デコーダ
テキストやファイルの変換をサポートし、Base64文字列を素早くエンコード/デコード
エスケープ/アンエスケープツール
JavaScript、JSON、HTML、XML、CSV、SQLなど複数の形式間で文字列をエスケープ・アンエスケープ