Tại sao dấu cách trong URL bị biến thành “%20”?
Chắc hẳn bạn đã từng thấy những đường link dài ngoằng, khó hiểu với sự xuất hiện của ký tự %20. Đây không phải là lỗi, mà là một cơ chế kỹ thuật của web. Tuy nhiên, sự tồn tại của nó lại là một “điểm trừ” lớn trong mắt cả người dùng và các công cụ tìm kiếm.
Giải thích nhanh về URL Encoding cho dấu cách
URL (Uniform Resource Locator) chỉ được phép chứa một bộ ký tự giới hạn theo tiêu chuẩn ASCII. Dấu cách (space) không nằm trong bộ ký tự này. Do đó, khi một trình duyệt hoặc hệ thống web gặp dấu cách trong một chuỗi định danh tài nguyên, nó phải “mã hóa” (encode) ký tự đó thành một định dạng hợp lệ để truyền đi trên internet.
Trong bảng mã ASCII, dấu cách có giá trị thập lục phân là 20. Vì vậy, cơ chế URL Encoding sẽ thay thế nó bằng chuỗi %20. % là ký tự escape, báo hiệu rằng hai ký tự tiếp theo là mã hex của ký tự gốc.
Nói đơn giản: %20 chính là “ngôn ngữ” mà máy tính dùng để biểu thị một dấu cách trong môi trường URL.
Tác động tiêu cực của space in url đến SEO và khả năng đọc
Việc giữ nguyên dấu cách (và để nó tự chuyển thành %20) gây ra nhiều vấn đề nghiêm trọng:
- Khó đọc và khó nhớ: URL
vi-du.com/bai%20viet%20moirõ ràng là kém thân thiện hơn rất nhiều so vớivi-du.com/bai-viet-moi. Người dùng khó có thể đọc, ghi nhớ hay gõ lại một URL chứa đầy ký tự mã hóa. - Giảm tỷ lệ nhấp (CTR): Khi chia sẻ trên mạng xã hội hoặc trong email, một đường link lộn xộn, trông như lỗi sẽ khiến người dùng e ngại và ít có khả năng nhấp vào hơn.
- Gây khó khăn cho SEO: Mặc dù các công cụ tìm kiếm hiện đại đã thông minh hơn trong việc diễn giải
%20, nhưng một URL rõ ràng, chứa từ khóa được phân tách bằng gạch ngang vẫn được ưu tiên và đánh giá cao hơn. Nó giúp Google hiểu cấu trúc và chủ đề của trang một cách nhanh chóng.

Giải pháp tối ưu: Thay dấu cách bằng gạch ngang (-)
Trong thế giới SEO, giải pháp được đồng thuận và hiệu quả nhất để xử lý dấu cách trong URL là sử dụng dấu gạch ngang (-).
Lý do Google và chuyên gia SEO khuyên dùng gạch ngang
John Mueller của Google đã nhiều lần xác nhận rằng gạch ngang (-) được sử dụng như một công cụ phân tách từ (word separator). Khi Googlebot quét một URL như xu-ly-dau-cach-trong-url, nó sẽ hiểu đây là cụm từ “xử lý dấu cách trong url”. Điều này giúp công cụ tìm kiếm xác định chính xác hơn nội dung và từ khóa mà trang web đang nhắm tới, từ đó cải thiện khả năng xếp hạng.
Ngược lại, các ký tự khác có thể không được diễn giải theo cách tương tự, dẫn đến việc hiểu sai ngữ cảnh của trang.
Cách cấu hình tự động thay thế dấu cách trong các CMS phổ biến (WordPress)
Rất may mắn, hầu hết các Hệ thống Quản trị Nội dung (CMS) hiện đại đều tự động xử lý vấn đề này. Với WordPress, nền tảng phổ biến nhất, khi bạn tạo một bài viết mới với tiêu đề “Xử lý dấu cách trong URL”, hệ thống sẽ tự động tạo ra một slug (phần cuối của URL) là xu-ly-dau-cach-trong-url.
Bạn có thể kiểm tra và tùy chỉnh điều này ngay bên dưới khung tiêu đề, trong phần “Permalink” (Đường dẫn tĩnh).
Ví dụ thực tế trước và sau khi xử lý dấu cách
- Trước khi xử lý:
https://funlink.io.vn/blog/bai viet ve SEO-> Sẽ hiển thị là:https://funlink.io.vn/blog/bai%20viet%20ve%20SEO - Sau khi xử lý:
https://funlink.io.vn/blog/bai-viet-ve-seo
Sự khác biệt là rất rõ ràng. URL sau khi xử lý không chỉ ngắn gọn, dễ đọc mà còn chứa từ khóa một cách mạch lạc, mang lại lợi ích trực tiếp cho cả người dùng và SEO.
Những sai lầm cần tránh khi tối ưu URL
Việc tối ưu URL không chỉ dừng lại ở việc thay dấu cách. Có những hiểu lầm phổ biến có thể vô tình làm hại đến nỗ lực SEO của bạn.
Dùng gạch dưới (_) thay vì gạch ngang (-): Hiểu lầm phổ biến
Đây là một trong những sai lầm kinh điển. Trong quá khứ và cả hiện tại, Google có xu hướng xem gạch dưới (_) là một ký tự nối, không phải ký tự phân tách. Điều này có nghĩa là URL bai_viet_ve_seo có thể được hiểu là một từ duy nhất “baivietveseo”, làm mất đi giá trị của từng từ khóa riêng lẻ.
Vì vậy, quy tắc vàng là: Luôn luôn dùng gạch ngang. Để hiểu sâu hơn về vấn đề này, bạn có thể tham khảo bài viết chi tiết của chúng tôi: Nên dùng gạch ngang hay gạch dưới trong URL.
Lỡ xuất bản URL chứa %20 url encoding: Hướng dẫn redirect 301 an toàn
Nếu bạn phát hiện ra website của mình đã có những URL chứa %20 được Google index và có traffic, đừng vội vàng xóa bỏ hay thay đổi chúng. Hành động này sẽ gây ra lỗi 404 và làm mất đi toàn bộ sức mạnh SEO đã tích lũy.
Giải pháp an toàn và chuẩn mực nhất là thực hiện chuyển hướng 301 (Redirect 301).
- Tạo URL mới: Tạo một phiên bản URL mới, sạch sẽ, sử dụng gạch ngang.
- Thiết lập Redirect 301: Cấu hình trên máy chủ hoặc sử dụng plugin (như Redirection cho WordPress) để tự động chuyển hướng tất cả người dùng và bot tìm kiếm từ URL cũ (
.../bai%20viet%20cu) sang URL mới (.../bai-viet-moi).
Redirect 301 sẽ thông báo cho công cụ tìm kiếm rằng trang đã được di chuyển vĩnh viễn, giúp chuyển giao gần như toàn bộ giá trị xếp hạng và traffic từ URL cũ sang URL mới.

Checklist và bước tiếp theo
Để đảm bảo mọi URL trên trang của bạn đều được tối ưu, hãy tuân thủ theo danh sách kiểm tra dưới đây.
Checklist nhanh để có một URL thân thiện với SEO
- [ ] Ngắn gọn và súc tích: Giữ URL càng ngắn càng tốt nhưng vẫn mô tả đủ nội dung.
- [ ] Sử dụng gạch ngang (-): Luôn dùng gạch ngang để phân tách các từ.
- [ ] Chứa từ khóa chính: Đặt từ khóa quan trọng nhất vào URL, ưu tiên gần tên miền.
- [ ] Sử dụng chữ thường: Tránh dùng chữ hoa để ngăn ngừa các vấn đề về trùng lặp nội dung.
- [ ] Loại bỏ các từ không cần thiết: Bỏ các từ dừng (stop words) như “và”, “là”, “của”, “trong”… nếu không làm thay đổi ngữ nghĩa.
CTA: Nâng cao kỹ năng xử lý các ký tự đặc biệt và tiếng Việt trong URL
Việc xử lý dấu cách chỉ là bước khởi đầu. Để xây dựng một cấu trúc URL hoàn hảo, bạn cần biết cách xử lý cả các ký tự đặc biệt và URL tiếng Việt có dấu. Hãy tiếp tục nâng cao kiến thức của mình qua bài viết hướng dẫn toàn diện của chúng tôi.
Tham khảo thêm: Cách tạo URL thân thiện với SEO.
