文字コード変換ツール
自動検出機能付きの高機能文字エンコーディング変換ツール
16進数出力
ファイルをドロップまたはクリックして選択
複数ファイル対応、各ファイル最大10MB
自動検出またはアップロードファイルのエンコーディングを手動で選択
選択されたファイル
| ファイル名 | サイズ | 変換元エンコーディング | プレビュー | 状態 |
|---|
文字コード変換ツールのドキュメント
文字エンコーディングとは?
文字エンコーディングとは、文字を数値(コードポイント)に対応付け、さらにバイトに変換するシステムです。エンコーディングが異なると対応関係も異なるため、間違ったエンコーディングでテキストを開くと文字化けが発生します。
使い方ガイド
テキスト変換モード
- 「テキスト変換」タブをクリックしてテキスト変換モードに入ります
- ドロップダウンから変換元エンコーディングを選択するか、「自動検出」を使用して自動的に識別します
- 変換先エンコーディングを選択します(デフォルトはUTF-8、最も汎用的なエンコーディング)
- 入出力形式を選択:プレーンテキスト、Base64、Hex、またはC/C++配列形式
- テキストを入力または貼り付けて「変換」ボタンをクリック。「コピー」で結果をコピー、「ダウンロード」でファイルとして保存
ファイル変換モード
- 「ファイル変換」タブをクリックしてファイルモードに入ります
- ファイルをアップロードエリアにドラッグ&ドロップするか、クリックしてファイルを選択(複数ファイル対応、各最大10MB)
- システムが各ファイルのエンコーディングを自動検出し、「変換元エンコーディング」列に表示。必要に応じて手動で変更可能
- すべてのファイルの変換先エンコーディングを選択
- 「すべて変換」をクリックして変換し、「すべてダウンロード」で変換済みファイルを保存
対応する入出力形式
- プレーンテキスト - 通常のテキストコンテンツ、直接入力または貼り付け
- Base64 - Base64エンコード文字列、メール添付やデータURLでよく使用
- Hex - 連続した16進数バイト、例: 48656C6C6F
- スペース区切りHex - スペースで区切られた16進数バイト、例: 48 65 6C 6C 6F
- C/C++配列 - C/C++スタイルのバイト配列形式、例: 0x48,0x65,0x6C,0x6C,0x6F
よくある使用例
文字化けの修正
文字化けしたテキストファイルやメールを受け取った場合、このツールで元のエンコーディングから正しいエンコーディングに変換して読める状態に復元できます。
データベース移行
異なるデータベースシステムやサーバー間でデータを移行する際、このツールで文字エンコーディングの一貫性を確保し、データの破損を防ぎます。
Web開発
レガシーWebページをUTF-8エンコーディングに変換し、モダンブラウザと異なるプラットフォームで正しく表示されるようにします。
クロスプラットフォームファイル共有
Windows(GBK)、macOS、Linuxシステム間でファイルを変換し、すべてのプラットフォームでテキストが正しく表示されるようにします。
ヒント
- 変換元エンコーディングが不明な場合は自動検出を使用
- 16進数表示を有効にすると実際のバイト値を確認可能
- Windowsで使用するUTF-8/UTF-16ファイルにはBOMを追加
- 一括変換にはファイル変換タブを使用
- エンコーディング間で変換する際、対象のエンコーディングに存在しない文字は「?」などのプレースホルダーに置き換えられます
対応エンコーディング一覧
このツールは世界の主要言語・地域をカバーする30以上の文字エンコーディングに対応しています。以下は各エンコーディングの詳細なリファレンスです。
Unicodeエンコーディング
中国語エンコーディング
| エンコーディング | 説明 | 用途 | 仕様書 |
|---|---|---|---|
| GBK | GB2312の拡張版。繁体字を含む21,003の中国語文字をサポート。簡体字中国語Windowsで一般的。 | 簡体字中国語Windows、旧ウェブサイト | IANA GBK |
| GB2312 | 中国の旧国家規格(1980年)。6,763の簡体字中国語文字と682の記号をサポート。 | レガシーシステム、メール | GB 2312-1980 |
| GB18030 | 中国の最新国家規格。すべてのUnicode文字と少数民族言語をサポート。 | 現代の中国語システム、政府文書 | GB 18030-2005 |
| Big5 | 繁体字中国語エンコーディング。主に台湾と香港で使用。13,060の繁体字を含む。 | 台湾、香港のウェブサイト | IANA Charset |
日本語エンコーディング
| エンコーディング | 説明 | 用途 | 仕様書 |
|---|---|---|---|
| Shift_JIS | Microsoftの日本語エンコーディング。JIS X 0201とJIS X 0208文字セットをサポート。 | Windows、旧ウェブサイト、ゲーム | IANA Charset |
| EUC-JP | 日本語用拡張Unixコード。ASCIIと互換性のある可変長エンコーディング。 | Unix/Linuxシステム、旧ウェブサイト | IANA Charset |
| ISO-2022-JP | エスケープシーケンスを使用する7ビット日本語エンコーディング。JISエンコーディングとも呼ばれる。 | 日本語メール、旧システム | RFC 1468 |
韓国語エンコーディング
| エンコーディング | 説明 | 用途 | 仕様書 |
|---|---|---|---|
| EUC-KR | 韓国語用拡張Unixコード。KS X 1001規格に基づく。8,822の韓国語文字(ハングル+漢字)をサポート。 | 韓国のウェブサイト、レガシーシステム | RFC 1557 |
西ヨーロッパエンコーディング
| エンコーディング | 説明 | 対応言語 | 仕様書 |
|---|---|---|---|
| ISO-8859-1 | Latin-1とも呼ばれる。ISO-8859シリーズの最初の部分。西ヨーロッパ言語の191文字をカバー。 | 英語、フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語 | ISO/IEC 8859-1 |
| ISO-8859-15 | Latin-9。Latin-1をユーロ記号(€)と追加のフランス語/フィンランド語文字で更新。 | ユーロ記号を含む西ヨーロッパ言語 | ISO/IEC 8859-15 |
| Windows-1252 | MicrosoftによるLatin-1の拡張。カーリー引用符やエムダッシュなどの活字文字を追加。 | Windows上の西ヨーロッパ言語 | Unicode.org |
キリル文字エンコーディング
| エンコーディング | 説明 | 対応言語 | 仕様書 |
|---|---|---|---|
| Windows-1251 | MicrosoftのWindows向けキリル文字エンコーディング。ロシア語およびその他のキリル文字ベースの言語をサポート。 | ロシア語、ウクライナ語、ブルガリア語、セルビア語 | Unicode.org |
| KOI8-R | 8ビットキリル文字エンコーディング。ロシア語用に設計。上位ビットが除去されても文字が読める。 | ロシア語 | RFC 1489 |
| ISO-8859-5 | ISO標準のキリル文字エンコーディング。ISO-8859シリーズの一部。基本的なキリル文字をサポート。 | ロシア語、ブルガリア語、マケドニア語、セルビア語 | ISO/IEC 8859-5 |
その他のエンコーディング
| エンコーディング | 説明 | 用途 | 仕様書 |
|---|---|---|---|
| ASCII | American Standard Code for Information Interchange。ほとんどの現代エンコーディングの基盤。128文字の7ビットエンコーディング。 | 基本的な英語テキスト、プログラミング | RFC 20 |
| Macintosh | AppleのMac OS Classic用オリジナル文字エンコーディング。Mac Romanとも呼ばれる。 | レガシーMacファイル、古いMacアプリケーション | Unicode.org |