Công cụ chuyển đổi mã hóa văn bản
Chuyển đổi văn bản giữa Hex, Binary, Unicode và các định dạng mã hóa khác
Chi tiết ký tự
Tài liệu công cụ chuyển đổi mã hóa
Mã hóa ký tự là gì?
Mã hóa ký tự là một hệ thống ánh xạ các ký tự thành số mà máy tính có thể xử lý. Các sơ đồ mã hóa khác nhau được sử dụng cho các mục đích khác nhau như lưu trữ, truyền tải hoặc hiển thị dữ liệu văn bản. Các mã hóa phổ biến bao gồm ASCII, UTF-8, UTF-16, v.v.
Định dạng được hỗ trợ
Thập lục phân (Hex)
Biểu diễn thập lục phân sử dụng các chữ số 0-9 và chữ cái A-F. Mỗi byte được biểu diễn bằng hai ký tự hex. Được sử dụng rộng rãi trong lập trình và gỡ lỗi.
Nhị phân
Biểu diễn nhị phân chỉ sử dụng 0 và 1. Mỗi byte được biểu diễn bằng 8 bit. Đây là biểu diễn dữ liệu cơ bản được sử dụng bởi máy tính.
Unicode Escape
Chuỗi escape Unicode ở định dạng \uXXXX, thường được sử dụng trong các ngôn ngữ lập trình như JavaScript và JSON để biểu diễn các ký tự Unicode.
Thực thể HTML
Mã hóa thực thể HTML, bao gồm các thực thể có tên (như &) và thực thể số (như & hoặc &). Được sử dụng để hiển thị an toàn các ký tự đặc biệt trong HTML.
Punycode
Sơ đồ mã hóa cho Tên miền quốc tế hóa (IDN). Chuyển đổi các ký tự Unicode sang mã hóa tương thích ASCII, có tiền tố xn--.
Trường hợp sử dụng phổ biến
- Xem biểu diễn thập lục phân hoặc nhị phân của các ký tự trong quá trình gỡ lỗi
- Xử lý mã hóa dữ liệu trong các giao thức mạng
- Phân tích và sửa các vấn đề về mã hóa (mojibake)
- Sử dụng chuỗi escape Unicode trong mã
- Xử lý Tên miền quốc tế hóa (IDN)
- Escape ký tự trong HTML/XML
Bộ ký tự vs Định dạng mã hóa
Bộ ký tự và định dạng mã hóa là hai khái niệm khác nhau. Bộ ký tự định nghĩa những ký tự nào được sử dụng trong văn bản (như ASCII, GB2312, GBK, Unicode, v.v.), trong khi định dạng mã hóa định nghĩa cách lưu trữ các ký tự này trên máy tính (như UTF-8, UTF-16, v.v.). Ví dụ, cùng một văn bản có thể được mã hóa bằng bộ ký tự GB2312 dưới dạng mã hóa GB2312, hoặc bằng bộ ký tự Unicode dưới dạng UTF-8.
Nếu bạn cần chuyển đổi giữa các bộ ký tự khác nhau (như GBK, UTF-8, ISO-8859-1, v.v.) thay vì chỉ thay đổi định dạng mã hóa, vui lòng sử dụng công cụ Chuyển đổi bộ ký tự.
Công Cụ Liên Quan
Bộ Chuyển Đổi Bộ Ký Tự
Chuyển đổi mã hóa văn bản giữa UTF-8, GBK, Big5, Shift_JIS, ISO-8859, các trang mã Windows với tự động phát hiện
Chuyển Đổi Cơ Số
Chuyển đổi giữa hệ nhị phân, bát phân, thập phân và thập lục phân với hỗ trợ cơ số tùy chỉnh (2-36)
Bộ Mã Hóa/Giải Mã URL
Mã hóa và giải mã URL để đảm bảo tuân thủ và khả năng sử dụng
Bộ Mã Hóa/Giải Mã HTML
Chuyển đổi ký tự đặc biệt thành thực thể HTML với định dạng tên, thập phân và thập lục phân để ngăn chặn tấn công XSS
Bộ Mã Hóa/Giải Mã Base64
Mã hóa và giải mã chuỗi Base64 nhanh chóng, hỗ trợ chuyển đổi cả văn bản và tệp
Công Cụ Escape/Unescape
Escape và unescape chuỗi giữa nhiều định dạng bao gồm JavaScript, JSON, HTML, XML, CSV, SQL và nhiều hơn nữa