CoderTools

文字コード変換ツール

自動検出機能付きの高機能文字エンコーディング変換ツール

入力文字数: 0 入力バイト数: 0
出力文字数: 0 出力バイト数: 0

文字コード変換ツールのドキュメント

文字エンコーディングとは?

文字エンコーディングとは、文字を数値(コードポイント)に対応付け、さらにバイトに変換するシステムです。エンコーディングが異なると対応関係も異なるため、間違ったエンコーディングでテキストを開くと文字化けが発生します。

使い方ガイド

テキスト変換モード

  1. 「テキスト変換」タブをクリックしてテキスト変換モードに入ります
  2. ドロップダウンから変換元エンコーディングを選択するか、「自動検出」を使用して自動的に識別します
  3. 変換先エンコーディングを選択します(デフォルトはUTF-8、最も汎用的なエンコーディング)
  4. 入出力形式を選択:プレーンテキスト、Base64、Hex、またはC/C++配列形式
  5. テキストを入力または貼り付けて「変換」ボタンをクリック。「コピー」で結果をコピー、「ダウンロード」でファイルとして保存

ファイル変換モード

  1. 「ファイル変換」タブをクリックしてファイルモードに入ります
  2. ファイルをアップロードエリアにドラッグ&ドロップするか、クリックしてファイルを選択(複数ファイル対応、各最大10MB)
  3. システムが各ファイルのエンコーディングを自動検出し、「変換元エンコーディング」列に表示。必要に応じて手動で変更可能
  4. すべてのファイルの変換先エンコーディングを選択
  5. 「すべて変換」をクリックして変換し、「すべてダウンロード」で変換済みファイルを保存

対応する入出力形式

  • プレーンテキスト - 通常のテキストコンテンツ、直接入力または貼り付け
  • Base64 - Base64エンコード文字列、メール添付やデータURLでよく使用
  • Hex - 連続した16進数バイト、例: 48656C6C6F
  • スペース区切りHex - スペースで区切られた16進数バイト、例: 48 65 6C 6C 6F
  • C/C++配列 - C/C++スタイルのバイト配列形式、例: 0x48,0x65,0x6C,0x6C,0x6F

よくある使用例

文字化けの修正

文字化けしたテキストファイルやメールを受け取った場合、このツールで元のエンコーディングから正しいエンコーディングに変換して読める状態に復元できます。

データベース移行

異なるデータベースシステムやサーバー間でデータを移行する際、このツールで文字エンコーディングの一貫性を確保し、データの破損を防ぎます。

Web開発

レガシーWebページをUTF-8エンコーディングに変換し、モダンブラウザと異なるプラットフォームで正しく表示されるようにします。

クロスプラットフォームファイル共有

Windows(GBK)、macOS、Linuxシステム間でファイルを変換し、すべてのプラットフォームでテキストが正しく表示されるようにします。

ヒント

  • 変換元エンコーディングが不明な場合は自動検出を使用
  • 16進数表示を有効にすると実際のバイト値を確認可能
  • Windowsで使用するUTF-8/UTF-16ファイルにはBOMを追加
  • 一括変換にはファイル変換タブを使用
  • エンコーディング間で変換する際、対象のエンコーディングに存在しない文字は「?」などのプレースホルダーに置き換えられます

対応エンコーディング一覧

このツールは世界の主要言語・地域をカバーする30以上の文字エンコーディングに対応しています。以下は各エンコーディングの詳細なリファレンスです。

Unicodeエンコーディング

エンコーディング 説明 バイト範囲 仕様書
UTF-8 可変長のUnicodeエンコーディング。ウェブで最も広く使用されており、ASCIIと下位互換性があります。 1-4 bytes RFC 3629
UTF-16 LE UTF-16リトルエンディアン。Windowsシステムで一般的に使用。1文字あたり2または4バイト。 2/4 bytes RFC 2781
UTF-16 BE UTF-16ビッグエンディアン。一部のネットワークプロトコルやJavaで使用。1文字あたり2または4バイト。 2/4 bytes RFC 2781

中国語エンコーディング

エンコーディング 説明 用途 仕様書
GBK GB2312の拡張版。繁体字を含む21,003の中国語文字をサポート。簡体字中国語Windowsで一般的。 簡体字中国語Windows、旧ウェブサイト IANA GBK
GB2312 中国の旧国家規格(1980年)。6,763の簡体字中国語文字と682の記号をサポート。 レガシーシステム、メール GB 2312-1980
GB18030 中国の最新国家規格。すべてのUnicode文字と少数民族言語をサポート。 現代の中国語システム、政府文書 GB 18030-2005
Big5 繁体字中国語エンコーディング。主に台湾と香港で使用。13,060の繁体字を含む。 台湾、香港のウェブサイト IANA Charset

日本語エンコーディング

エンコーディング 説明 用途 仕様書
Shift_JIS Microsoftの日本語エンコーディング。JIS X 0201とJIS X 0208文字セットをサポート。 Windows、旧ウェブサイト、ゲーム IANA Charset
EUC-JP 日本語用拡張Unixコード。ASCIIと互換性のある可変長エンコーディング。 Unix/Linuxシステム、旧ウェブサイト IANA Charset
ISO-2022-JP エスケープシーケンスを使用する7ビット日本語エンコーディング。JISエンコーディングとも呼ばれる。 日本語メール、旧システム RFC 1468

韓国語エンコーディング

エンコーディング 説明 用途 仕様書
EUC-KR 韓国語用拡張Unixコード。KS X 1001規格に基づく。8,822の韓国語文字(ハングル+漢字)をサポート。 韓国のウェブサイト、レガシーシステム RFC 1557

西ヨーロッパエンコーディング

エンコーディング 説明 対応言語 仕様書
ISO-8859-1 Latin-1とも呼ばれる。ISO-8859シリーズの最初の部分。西ヨーロッパ言語の191文字をカバー。 英語、フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語 ISO/IEC 8859-1
ISO-8859-15 Latin-9。Latin-1をユーロ記号(€)と追加のフランス語/フィンランド語文字で更新。 ユーロ記号を含む西ヨーロッパ言語 ISO/IEC 8859-15
Windows-1252 MicrosoftによるLatin-1の拡張。カーリー引用符やエムダッシュなどの活字文字を追加。 Windows上の西ヨーロッパ言語 Unicode.org

キリル文字エンコーディング

エンコーディング 説明 対応言語 仕様書
Windows-1251 MicrosoftのWindows向けキリル文字エンコーディング。ロシア語およびその他のキリル文字ベースの言語をサポート。 ロシア語、ウクライナ語、ブルガリア語、セルビア語 Unicode.org
KOI8-R 8ビットキリル文字エンコーディング。ロシア語用に設計。上位ビットが除去されても文字が読める。 ロシア語 RFC 1489
ISO-8859-5 ISO標準のキリル文字エンコーディング。ISO-8859シリーズの一部。基本的なキリル文字をサポート。 ロシア語、ブルガリア語、マケドニア語、セルビア語 ISO/IEC 8859-5

その他のエンコーディング

エンコーディング 説明 用途 仕様書
ASCII American Standard Code for Information Interchange。ほとんどの現代エンコーディングの基盤。128文字の7ビットエンコーディング。 基本的な英語テキスト、プログラミング RFC 20
Macintosh AppleのMac OS Classic用オリジナル文字エンコーディング。Mac Romanとも呼ばれる。 レガシーMacファイル、古いMacアプリケーション Unicode.org

関連ツール