문자셋 변환기
자동 감지 기능을 갖춘 전문 문자 인코딩 변환 도구
16진수 출력
파일을 여기에 놓거나 클릭하여 선택
여러 파일 지원, 파일당 최대 10MB
자동 감지 또는 업로드된 파일의 인코딩 수동 선택
선택된 파일
| 파일 이름 | 크기 | 원본 인코딩 | 미리보기 | 상태 |
|---|
문자셋 변환기 문서
문자 인코딩이란?
문자 인코딩은 문자를 숫자(코드 포인트)로 매핑하고 이를 다시 바이트로 변환하는 시스템입니다. 인코딩마다 다른 매핑을 사용하기 때문에 잘못된 인코딩으로 텍스트를 열면 글자가 깨져 보입니다.
사용 가이드
텍스트 변환 모드
- '텍스트 변환' 탭을 클릭하여 텍스트 변환 모드로 진입
- 드롭다운에서 원본 인코딩 선택 또는 '자동 감지'를 사용하여 자동 식별
- 대상 인코딩 선택 (기본값은 UTF-8, 가장 보편적인 인코딩)
- 입출력 형식 선택: 일반 텍스트, Base64, Hex 또는 C/C++ 배열 형식
- 텍스트를 입력하거나 붙여넣고 '변환' 버튼 클릭. '복사'로 결과 복사, '다운로드'로 파일로 저장
파일 변환 모드
- '파일 변환' 탭을 클릭하여 파일 모드로 진입
- 파일을 업로드 영역에 드래그 앤 드롭하거나 클릭하여 선택 (여러 파일 지원, 각 최대 10MB)
- 시스템이 각 파일의 인코딩을 자동 감지하여 '원본 인코딩' 열에 표시. 필요시 수동으로 변경 가능
- 모든 파일의 대상 인코딩 선택
- '모두 변환'을 클릭하여 변환, '모두 다운로드'로 변환된 파일 저장
지원되는 입출력 형식
- 일반 텍스트 - 일반 텍스트 콘텐츠, 직접 입력 또는 붙여넣기
- Base64 - Base64 인코딩된 문자열, 이메일 첨부파일 및 데이터 URL에서 일반적으로 사용
- Hex - 연속된 16진수 바이트, 예: 48656C6C6F
- 공백 구분 Hex - 공백으로 구분된 16진수 바이트, 예: 48 65 6C 6C 6F
- C/C++ 배열 - C/C++ 스타일 바이트 배열 형식, 예: 0x48,0x65,0x6C,0x6C,0x6F
일반적인 사용 사례
깨진 문자 수정
깨진 문자가 있는 텍스트 파일이나 이메일을 받았을 때, 이 도구를 사용하여 원래 인코딩에서 올바른 인코딩으로 변환하여 읽을 수 있는 콘텐츠로 복원합니다.
데이터베이스 마이그레이션
서로 다른 데이터베이스 시스템이나 서버 간에 데이터를 마이그레이션할 때, 이 도구를 사용하여 문자 인코딩 일관성을 보장하고 데이터 손상을 방지합니다.
웹 개발
레거시 웹 페이지를 UTF-8 인코딩으로 변환하여 최신 브라우저와 다양한 플랫폼에서 올바르게 표시되도록 합니다.
크로스 플랫폼 파일 공유
Windows(GBK), macOS, Linux 시스템 간에 파일을 변환하여 모든 플랫폼에서 텍스트가 올바르게 표시되도록 합니다.
팁
- 원본 인코딩이 확실하지 않을 때 자동 감지 사용
- 16진수 보기를 활성화하면 실제 바이트 값 확인 가능
- Windows에서 사용할 UTF-8/UTF-16 파일에 BOM 추가
- 일괄 변환은 파일 변환 탭 사용
- 인코딩 간 변환 시 대상 인코딩에 존재하지 않는 문자는 '?' 또는 유사한 문자로 대체됨
지원 인코딩 참조
이 도구는 전 세계 주요 언어와 지역을 포괄하는 30개 이상의 문자 인코딩을 지원합니다. 아래는 각 지원 인코딩에 대한 상세 참조입니다.
유니코드 인코딩
중국어 인코딩
| 인코딩 | 설명 | 용도 | 사양 |
|---|---|---|---|
| GBK | GB2312의 확장으로 번체자를 포함한 21,003개의 중국어 문자를 지원합니다. 간체 중국어 Windows에서 일반적입니다. | 간체 중국어 Windows, 구형 웹사이트 | IANA GBK |
| GB2312 | 중국 최초의 국가 표준(1980), 6,763개의 간체 중국어 문자와 682개의 기호를 지원합니다. | 레거시 시스템, 이메일 | GB 2312-1980 |
| GB18030 | 중국 최신 국가 표준으로 중국에서 의무화되어 있습니다. 소수 민족 언어를 포함한 모든 유니코드 문자를 지원합니다. | 현대 중국어 시스템, 정부 문서 | GB 18030-2005 |
| Big5 | 번체 중국어 인코딩으로 주로 대만과 홍콩에서 사용됩니다. 13,060개의 번체자를 포함합니다. | 대만, 홍콩 웹사이트 | IANA Charset |
일본어 인코딩
| 인코딩 | 설명 | 용도 | 사양 |
|---|---|---|---|
| Shift_JIS | Microsoft의 일본어 인코딩으로 JIS X 0201 및 JIS X 0208 문자 세트를 지원합니다. | Windows, 구형 웹사이트, 게임 | IANA Charset |
| EUC-JP | 일본어용 확장 Unix 코드로 ASCII와 호환되는 가변 길이 인코딩입니다. | Unix/Linux 시스템, 구형 웹사이트 | IANA Charset |
| ISO-2022-JP | 이스케이프 시퀀스를 사용하는 7비트 일본어 인코딩. JIS 인코딩이라고도 합니다. | 일본어 이메일, 구형 시스템 | RFC 1468 |
한국어 인코딩
| 인코딩 | 설명 | 용도 | 사양 |
|---|---|---|---|
| EUC-KR | 한국어용 확장 Unix 코드로 KS X 1001 표준을 기반으로 합니다. 8,822개의 한국어 문자(한글 + 한자)를 지원합니다. | 한국 웹사이트, 레거시 시스템 | RFC 1557 |
서유럽 인코딩
| 인코딩 | 설명 | 언어 | 사양 |
|---|---|---|---|
| ISO-8859-1 | Latin-1이라고도 합니다. ISO-8859 시리즈의 첫 번째 부분으로 서유럽 언어의 191자를 포함합니다. | 영어, 프랑스어, 독일어, 스페인어, 포르투갈어, 이탈리아어 | ISO/IEC 8859-1 |
| ISO-8859-15 | Latin-9는 Latin-1을 유로 기호(€)와 추가 프랑스어/핀란드어 문자로 업데이트합니다. | 유로 기호가 있는 서유럽 언어 | ISO/IEC 8859-15 |
| Windows-1252 | Microsoft의 Latin-1 확장으로 곡선 따옴표와 대시 같은 인쇄 문자를 추가합니다. | Windows의 서유럽 언어 | Unicode.org |
키릴 문자 인코딩
| 인코딩 | 설명 | 언어 | 사양 |
|---|---|---|---|
| Windows-1251 | Windows용 Microsoft의 키릴 문자 인코딩으로 러시아어 및 기타 키릴 문자 기반 언어를 지원합니다. | 러시아어, 우크라이나어, 불가리아어, 세르비아어 | Unicode.org |
| KOI8-R | 러시아어용으로 설계된 8비트 키릴 문자 인코딩. 상위 비트가 제거되어도 문자를 읽을 수 있습니다. | 러시아어 | RFC 1489 |
| ISO-8859-5 | ISO-8859 시리즈의 일부인 ISO 표준 키릴 문자 인코딩. 기본 키릴 문자를 지원합니다. | 러시아어, 불가리아어, 마케도니아어, 세르비아어 | ISO/IEC 8859-5 |
기타 인코딩
| 인코딩 | 설명 | 용도 | 사양 |
|---|---|---|---|
| ASCII | American Standard Code for Information Interchange, 대부분의 현대 인코딩의 기반. 128자의 7비트 인코딩. | 기본 영어 텍스트, 프로그래밍 | RFC 20 |
| Macintosh | Mac OS Classic용 Apple의 원래 문자 인코딩. Mac Roman이라고도 합니다. | 레거시 Mac 파일, 구형 Mac 애플리케이션 | Unicode.org |