文字コード変換ツール

自動検出機能付きの高機能文字エンコーディング変換ツール

変換元エンコーディング

変換先エンコーディング

変換オプション

BOM（バイト順マーク）を追加

既存のBOMを削除

16進数を表示

入力形式

出力形式

入力テキスト

入力文字数: 0 入力バイト数: 0

出力テキスト

出力文字数: 0 出力バイト数: 0

16進数出力

🔒 100% ローカル処理入力されたデータはすべてブラウザ内で処理されます。サーバーに送信されることはありません。

ファイルをドロップまたはクリックして選択

複数ファイル対応（大きなファイルはパフォーマンスに影響する場合があります）

変換元エンコーディング

自動検出またはアップロードファイルのエンコーディングを手動で選択

変換先エンコーディング

選択されたファイル

ファイル名	サイズ	変換元エンコーディング	プレビュー	状態

文字コード変換ツールのドキュメント

文字エンコーディングとは？

文字エンコーディングとは、文字を数値（コードポイント）に対応付け、さらにバイトに変換するシステムです。エンコーディングが異なると対応関係も異なるため、間違ったエンコーディングでテキストを開くと文字化けが発生します。

使い方ガイド

テキスト変換モード

「テキスト変換」タブをクリックしてテキスト変換モードに入ります
ドロップダウンから変換元エンコーディングを選択するか、「自動検出」を使用して自動的に識別します
変換先エンコーディングを選択します（デフォルトはUTF-8、最も汎用的なエンコーディング）
入出力形式を選択：プレーンテキスト、Base64、Hex、またはC/C++配列形式
テキストを入力または貼り付けて「変換」ボタンをクリック。「コピー」で結果をコピー、「ダウンロード」でファイルとして保存

ファイル変換モード

「ファイル変換」タブをクリックしてファイルモードに入ります
ファイルをアップロードエリアにドラッグ＆ドロップするか、クリックしてファイルを選択（複数ファイル対応）
システムが各ファイルのエンコーディングを自動検出し、「変換元エンコーディング」列に表示。必要に応じて手動で変更可能
すべてのファイルの変換先エンコーディングを選択
「すべて変換」をクリックして変換し、「すべてダウンロード」で変換済みファイルを保存

対応する入出力形式

プレーンテキスト - 通常のテキストコンテンツ、直接入力または貼り付け
Base64 - Base64エンコード文字列、メール添付やデータURLでよく使用
Hex - 連続した16進数バイト、例: 48656C6C6F
スペース区切りHex - スペースで区切られた16進数バイト、例: 48 65 6C 6C 6F
C/C++配列 - C/C++スタイルのバイト配列形式、例: 0x48,0x65,0x6C,0x6C,0x6F

よくある使用例

文字化けの修正

文字化けしたテキストファイルやメールを受け取った場合、このツールで元のエンコーディングから正しいエンコーディングに変換して読める状態に復元できます。

データベース移行

異なるデータベースシステムやサーバー間でデータを移行する際、このツールで文字エンコーディングの一貫性を確保し、データの破損を防ぎます。

Web開発

レガシーWebページをUTF-8エンコーディングに変換し、モダンブラウザと異なるプラットフォームで正しく表示されるようにします。

クロスプラットフォームファイル共有

Windows（GBK）、macOS、Linuxシステム間でファイルを変換し、すべてのプラットフォームでテキストが正しく表示されるようにします。

ヒント

変換元エンコーディングが不明な場合は自動検出を使用
16進数表示を有効にすると実際のバイト値を確認可能
Windowsで使用するUTF-8/UTF-16ファイルにはBOMを追加
一括変換にはファイル変換タブを使用
エンコーディング間で変換する際、対象のエンコーディングに存在しない文字は「?」などのプレースホルダーに置き換えられます

対応エンコーディング一覧

このツールは世界の主要言語・地域をカバーする30以上の文字エンコーディングに対応しています。以下は各エンコーディングの詳細なリファレンスです。

Unicodeエンコーディング

エンコーディング	説明	バイト範囲	仕様書
UTF-8	可変長のUnicodeエンコーディング。ウェブで最も広く使用されており、ASCIIと下位互換性があります。	1-4 bytes	RFC 3629
UTF-16 LE	UTF-16リトルエンディアン。Windowsシステムで一般的に使用。1文字あたり2または4バイト。	2/4 bytes	RFC 2781
UTF-16 BE	UTF-16ビッグエンディアン。一部のネットワークプロトコルやJavaで使用。1文字あたり2または4バイト。	2/4 bytes	RFC 2781

中国語エンコーディング

エンコーディング	説明	用途	仕様書
GBK	GB2312の拡張版。繁体字を含む21,003の中国語文字をサポート。簡体字中国語Windowsで一般的。	簡体字中国語Windows、旧ウェブサイト	IANA GBK
GB2312	中国の旧国家規格（1980年）。6,763の簡体字中国語文字と682の記号をサポート。	レガシーシステム、メール	GB 2312-1980
GB18030	中国の最新国家規格。すべてのUnicode文字と少数民族言語をサポート。	現代の中国語システム、政府文書	GB 18030-2005
Big5	繁体字中国語エンコーディング。主に台湾と香港で使用。13,060の繁体字を含む。	台湾、香港のウェブサイト	IANA Charset

日本語エンコーディング

エンコーディング	説明	用途	仕様書
Shift_JIS	Microsoftの日本語エンコーディング。JIS X 0201とJIS X 0208文字セットをサポート。	Windows、旧ウェブサイト、ゲーム	IANA Charset
EUC-JP	日本語用拡張Unixコード。ASCIIと互換性のある可変長エンコーディング。	Unix/Linuxシステム、旧ウェブサイト	IANA Charset
ISO-2022-JP	エスケープシーケンスを使用する7ビット日本語エンコーディング。JISエンコーディングとも呼ばれる。	日本語メール、旧システム	RFC 1468

韓国語エンコーディング

エンコーディング	説明	用途	仕様書
EUC-KR	韓国語用拡張Unixコード。KS X 1001規格に基づく。8,822の韓国語文字（ハングル+漢字）をサポート。	韓国のウェブサイト、レガシーシステム	RFC 1557

西ヨーロッパエンコーディング

エンコーディング	説明	対応言語	仕様書
ISO-8859-1	Latin-1とも呼ばれる。ISO-8859シリーズの最初の部分。西ヨーロッパ言語の191文字をカバー。	英語、フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語	ISO/IEC 8859-1
ISO-8859-15	Latin-9。Latin-1をユーロ記号（€）と追加のフランス語/フィンランド語文字で更新。	ユーロ記号を含む西ヨーロッパ言語	ISO/IEC 8859-15
Windows-1252	MicrosoftによるLatin-1の拡張。カーリー引用符やエムダッシュなどの活字文字を追加。	Windows上の西ヨーロッパ言語	Unicode.org

キリル文字エンコーディング

エンコーディング	説明	対応言語	仕様書
Windows-1251	MicrosoftのWindows向けキリル文字エンコーディング。ロシア語およびその他のキリル文字ベースの言語をサポート。	ロシア語、ウクライナ語、ブルガリア語、セルビア語	Unicode.org
KOI8-R	8ビットキリル文字エンコーディング。ロシア語用に設計。上位ビットが除去されても文字が読める。	ロシア語	RFC 1489
ISO-8859-5	ISO標準のキリル文字エンコーディング。ISO-8859シリーズの一部。基本的なキリル文字をサポート。	ロシア語、ブルガリア語、マケドニア語、セルビア語	ISO/IEC 8859-5

その他のエンコーディング

エンコーディング	説明	用途	仕様書
ASCII	American Standard Code for Information Interchange。ほとんどの現代エンコーディングの基盤。128文字の7ビットエンコーディング。	基本的な英語テキスト、プログラミング	RFC 20
Macintosh	AppleのMac OS Classic用オリジナル文字エンコーディング。Mac Romanとも呼ばれる。	レガシーMacファイル、古いMacアプリケーション	Unicode.org

よくある質問

文字エンコーディングとは何ですか？なぜ重要なのですか？

文字エンコーディングとは、文字（文字、記号、数字）と数値バイト値との対応関係のことです。コンピューターはテキストを数値として保存し、エンコーディングがどの数値がどの文字に対応するかを示します。送信側と受信側が異なるエンコーディングを使用すると、バイトが誤って解釈されて文字化けが起きます。UTF-8はウェブの標準で、ほぼすべての言語に対応しています。

GBK、GB2312、GB18030の違いは何ですか？

いずれも中国の国家文字エンコーディング規格です。GB2312（1981年）は6,763の簡体字中国語を収録。GBK（1993年）はGB2312の拡張版で繁体字を含む約21,000文字を追加。GB18030（2005年）は現行の必須国家規格で全Unicodeを含み、3つの中で最も完全です。

変換後もテキストが文字化けするのはなぜですか？

変換後も文字化けする場合、通常は元のエンコーディングが間違って選択されています。GBKで保存されたファイルをUTF-8として読み込むと、バイトが誤って解釈されます。異なるソースエンコーディングを試してみてください。アジア言語にはGBK、Shift-JIS、EUC-KR、Big5が。欧州言語にはWindows-1252やISO-8859-1が一般的です。

Shift-JISとは何ですか？いつ使われますか？

Shift-JIS（日本工業規格シフト）は1980年代に開発された日本語文字エンコーディングで、Microsoft Windowsや多くの日本語アプリケーション・ウェブサイトで使用されてきました。現代のシステムではUTF-8が主流ですが、古いデータベース、組み込みシステム、レトロゲームROMでは今もShift-JISが見られます。

UTF-8とUTF-16間で変換できますか？

はい。UTF-8とUTF-16は同じUnicodeコードポイントをエンコードしており、同じ文字を異なるバイト表現で格納しているだけです。UTF-8は1文字あたり1〜4バイトでASCIIテキストに効率的。UTF-16は1文字あたり2または4バイトで、Windows、Java、JavaScriptエンジンが内部的に使用します。変換はバイト表現を変えるだけで、文字自体は変わりません。

文字コード変換ツール

16進数出力

選択されたファイル

文字コード変換ツールのドキュメント

文字エンコーディングとは？

使い方ガイド

テキスト変換モード

ファイル変換モード

対応する入出力形式

よくある使用例

文字化けの修正

データベース移行

Web開発

クロスプラットフォームファイル共有

ヒント

対応エンコーディング一覧

Unicodeエンコーディング

中国語エンコーディング

日本語エンコーディング

韓国語エンコーディング

西ヨーロッパエンコーディング

キリル文字エンコーディング

その他のエンコーディング

よくある質問

関連ツール

テキストエンコーディング変換

Base64エンコーダ/デコーダ

URLエンコーダ/デコーダ

HTMLエンコーダー/デコーダー

クイックメニュー

文字コード変換ツール

16進数出力

選択されたファイル

文字コード変換ツールのドキュメント

文字エンコーディングとは？

使い方ガイド

テキスト変換モード

ファイル変換モード

対応する入出力形式

よくある使用例

文字化けの修正

データベース移行

Web開発

クロスプラットフォームファイル共有

ヒント

対応エンコーディング一覧

Unicodeエンコーディング

中国語エンコーディング

日本語エンコーディング

韓国語エンコーディング

西ヨーロッパエンコーディング

キリル文字エンコーディング

その他のエンコーディング

よくある質問

関連ツール

テキストエンコーディング変換

Base64エンコーダ/デコーダ

URLエンコーダ/デコーダ

HTMLエンコーダー/デコーダー

クイックメニュー

Cookie設定

必須Cookie

分析Cookie