Công Cụ Kiểm Tra XPath
Kiểm tra và xác thực biểu thức XPath trực tuyến với kết quả tức thì
Kết quả khớp
Chi tiết kết quả
Mẫu nhanh
Tài liệu công cụ XPath
Hiểu về XPath
XPath (Ngôn ngữ đường dẫn XML) là ngôn ngữ truy vấn để chọn các nút từ tài liệu XML và HTML. Nó sử dụng biểu thức đường dẫn để điều hướng qua các phần tử và thuộc tính trong cấu trúc cây tài liệu.
Đường dẫn tuyệt đối
/html/body/div
Bắt đầu từ nút gốc. Sử dụng khi bạn biết cấu trúc chính xác của tài liệu.
Đường dẫn tương đối
//div[@class='content']
Chọn các nút ở bất kỳ đâu trong tài liệu. Linh hoạt hơn và thường được sử dụng.
Tham chiếu cú pháp XPath
Biểu thức chọn
| Biểu thức | Mô tả |
|---|---|
/ |
Chọn từ nút gốc (đường dẫn tuyệt đối) |
// |
Chọn các nút ở bất kỳ đâu bên dưới ngữ cảnh hiện tại (đường dẫn tương đối) |
. |
Chọn nút hiện tại |
.. |
Chọn cha của nút hiện tại |
@ |
Chọn thuộc tính |
* |
Khớp với bất kỳ nút phần tử nào |
Vị từ (Bộ lọc)
| Biểu thức | Mô tả |
|---|---|
[1] |
Chọn phần tử đầu tiên |
[last()] |
Chọn phần tử cuối cùng |
[@attr] |
Chọn các phần tử có thuộc tính được chỉ định |
[@attr='val'] |
Chọn các phần tử có thuộc tính bằng giá trị |
[position()<3] |
Chọn các phần tử ở vị trí nhỏ hơn 3 |
Hàm phổ biến
text()
Chọn nội dung văn bản của nút
contains()
Kiểm tra xem chuỗi có chứa chuỗi con không
starts-with()
Kiểm tra xem chuỗi có bắt đầu bằng tiền tố không
normalize-space()
Xóa khoảng trắng đầu/cuối
count()
Đếm số lượng nút
not()
Trả về true nếu điều kiện là false
Ví dụ thực tế XPath
Chọn liên kết ngoài
//a[@href and contains(@class, 'external')]
Tìm tất cả các phần tử anchor có thuộc tính href và chứa 'external' trong class.
Chọn dữ liệu bảng (bỏ qua tiêu đề)
//table//tr[position() > 1]/td[1]
Chọn ô đầu tiên của mỗi hàng bảng, ngoại trừ hàng tiêu đề.
Trích xuất nội dung văn bản hiển thị
//*[not(self::script) and not(self::style)]//text()
Lấy tất cả các nút văn bản ngoại trừ những nút bên trong các phần tử script và style.
Trục XPath
Các trục xác định mối quan hệ giữa nút hiện tại và các nút khác trong cây tài liệu.
ancestor::
Chọn tất cả tổ tiên (cha, ông bà, v.v.)
descendant::
Chọn tất cả con cháu (con, cháu, v.v.)
following-sibling::
Chọn tất cả anh chị em sau nút hiện tại
preceding-sibling::
Chọn tất cả anh chị em trước nút hiện tại
child::
Chọn tất cả con của nút hiện tại
parent::
Chọn cha của nút hiện tại
Công Cụ Liên Quan
Trình Định Dạng XML
Định dạng và xác thực dữ liệu XML với làm nổi bật cú pháp
Trình Định Dạng JSON
Định dạng và xác thực dữ liệu JSON để cải thiện khả năng đọc và gỡ lỗi
Trình Kiểm Tra Regex
Kiểm tra và gỡ lỗi biểu thức chính quy với kết quả khớp tức thì
Nén & Làm Đẹp HTML
Nén hoặc làm đẹp mã HTML, loại bỏ khoảng trắng và chú thích để tối ưu kích thước tệp, hoặc định dạng mã để dễ đọc