CoderTools

テキストエンコーディング変換ツール

16進数、2進数、Unicodeなど様々なエンコーディング形式間でテキストを変換

バイト区切り:
プレフィックス追加:

エンコーディング変換ドキュメント

文字エンコーディングとは?

文字エンコーディングは、文字をコンピュータが処理できる数値にマッピングするシステムです。異なるエンコーディング方式は、テキストデータの保存、転送、表示など、異なる目的に使用されます。一般的なエンコーディングにはASCII、UTF-8、UTF-16などがあります。

サポートされている形式

16進数 (Hex)

0-9とA-Fを使用する16進数表現。各バイトは2つの16進文字で表されます。プログラミングやデバッグで広く使用されています。

2進数 (Binary)

0と1のみを使用する2進数表現。各バイトは8ビットで表されます。これはコンピュータの基本的なデータ表現方法です。

Unicodeエスケープ

\uXXXX形式のUnicodeエスケープシーケンス。JavaScriptやJSONなどのプログラミング言語でUnicode文字を表現するために一般的に使用されます。

HTMLエンティティ

HTMLエンティティエンコーディング。名前付きエンティティ(&など)と数値エンティティ(&や&など)を含みます。HTMLで特殊文字を安全に表示するために使用されます。

Punycode

国際化ドメイン名(IDN)のエンコーディング方式。Unicode文字をxn--で始まるASCII互換エンコーディングに変換します。

一般的な使用例

  • デバッグ中に文字の16進数または2進数表現を確認
  • ネットワークプロトコルでのデータエンコーディング処理
  • 文字化け問題の分析と修正
  • コードでUnicodeエスケープシーケンスを使用
  • 国際化ドメイン名(IDN)の処理
  • HTML/XMLでの文字エスケープ

文字セット vs エンコーディング形式

文字セットとエンコーディング形式は2つの異なる概念です。文字セットはテキストで使用される文字を定義し(ASCII、GB2312、GBK、Unicodeなど)、エンコーディング形式はこれらの文字がコンピュータにどのように格納されるかを定義します(UTF-8、UTF-16など)。たとえば、同じテキストはGB2312文字セットをGB2312エンコーディングとしてエンコードすることも、Unicode文字セットをUTF-8としてエンコードすることもできます。

GBK、UTF-8、ISO-8859-1など、異なる文字セット間で変換する必要があり、エンコーディング形式を変更するだけではない場合は、文字セット変換ツールを使用してください。

よくある質問

エンコードと暗号化の違いは何ですか?

エンコードは公知のスキームを使ってデータを別の表現に変換します。秘密鍵は不要で、誰でも元に戻せます。暗号化は秘密鍵を使ってデータを変換し、鍵を持つ人だけが復元できます。Base64や16進数はエンコード、AESやRSAは暗号化アルゴリズムです。

Base64エンコードされたテキストの末尾に=や==があるのはなぜですか?

Base64は3バイトの入力を4文字の出力にエンコードします。入力長が3の倍数でない場合、出力が4の倍数になるよう=でパディングされます。=一つは1バイトのパディング、==は2バイトを意味します。パディングを省略する実装もありますが、デコーダーが対応していれば両方有効です。

ASCIIとUnicodeの違いは何ですか?

ASCIIは128文字(A-Z、0-9、一般的な記号)を扱う7ビットエンコードです。Unicodeはすべての書記体系の14万文字以上をカバーする文字集合標準です。UTF-8、UTF-16、UTF-32はUnicodeコードポイントのバイト表現方法で、UTF-8は最初の128コードポイントでASCIIと後方互換性があります。

Base64の代わりに16進数エンコードを使うべき場面はいつですか?

16進数(Base16)は各バイトを2桁の16進数で表すため冗長ですが、バイトストリームや暗号鍵、バイナリプロトコル値のデバッグに直感的で便利です。Base64は約33%コンパクトで、JSON、メール、URLでバイナリデータを送信する際に適しています。

UnicodeコードポイントのU+XXXX表記は何を意味しますか?

U+XXXXはUnicodeコードポイントの標準表記で、XXXXは16進数です。たとえばU+0041はラテン大文字A、U+4E2Dは漢字「中」です。コードポイントはU+0000からU+10FFFFまで範囲があります。U+プレフィックスはUnicodeコンソーシアムがコードポイントとバイト値を区別するために導入しました。

関連ツール

クイックメニュー

最近のツールはありません