Thành phần sitemaps XML là một dạng sơ đồ trang web, đây được xem là một trong những phần quan trọng nhất để có thể tối ưu hóa bất kỳ website nào. Ngoài việc tìm kiếm sơ đồ chi tiết về các trang web thì thành phần sitemaps còn bao gồm nhiều dữ liệu có giá trị khác nhau. Mục đích chính của sơ đồ này chính là cung cấp thông tin cho các công cụ tìm kiếm để thu thập và index thông tin site nhanh hơn. Thế nhưng, làm sao để tối ưu sitemaps XML một cách hiệu quả và đem lại kết quả tốt nhất, hãy cùng chúng tôi tìm hiểu trong nội dung dưới đây.
Khái niệm Sitemaps XML là gì?
Sitemap XML là một tệp thông tin của website còn hiểu theo cách khác là một bản đồ của 1 website, được các công cụ tìm kiếm sử dụng để thu thập thông tin của một website (như bài viết mới, bài viết được cập nhật, hình ảnh, video) và lập chỉ mục, nếu tốt sẽ nhanh chóng xếp hạng cao trên các công cụ tìm kiếm.Chúng ta luôn muốn Google thu thập dữ liệu mọi trang quan trọng trên website một cách nhanh chóng.
Nhưng thông thường các bài viết mới thì không có liên kết internal tới, điều này gây khó khăn cho bot Google lập chỉ mục.Chính lý do này thì website bắt buộc phải có Sitemap để đảm bảo Google có thể thu thập dữ liệu một cách nhanh nhất. Ngoài ra, sơ đồ này còn cho chúng ta nhiều dữ liệu có giá trị như:
- + Tần suất mỗi trang được cập nhật
- + Thay đổi lần cuối
- + Các trang quan trọng có liên quan với nhau như thế nào?
Sitemaps XML sẽ hỗ trợ trang của bạn được Google index nhanh hơn. Vậy nên, sơ đồ trang đặc biệt quan trọng với website. Tìm ra cách tối ưu chúng là việc nên làm. Bài viết này sẽ đưa ra 13 thực tiễn tốt nhất nhằm tối ưu sitemaps XML.
Những yếu tố tốt nhất giúp tối ưu sitemaps XML
Cách sử dụng công cụ và plugin để tự động tạo sơ đồ trang
Tạo sơ đồ trang web rất dễ dàng khi có công cụ phù hợp. Chẳng hạn là phần mềm xây dựng XML Sitemap hoặc plugin phổ biến như Google XML Sitemaps.Trên thực tế, các trang WordPress đã sử dụng Yoast SEO có thể cho phép tạo sơ đồ trang web XML trực tiếp trong plugin.Bạn cũng có thể tạo sơ đồ trang theo cấu trúc mã trang web XML. Về mặt kỹ thuật, sơ đồ trang web của bạn thậm chí không cần phải ở định dạng XML.
Tuy nhiên, cần thiết phải tạo một sơ đồ trang XML hoàn chỉnh nếu muốn thực hiện thuộc tính hreflang. Do đó, hãy nhờ đến công cụ ngay thôi.Truy cập trang chính thức của Google và Bing để biết thêm thông tin về cách thiết lập sơ đồ trang web theo cách thủ công.
Thực hiện submit sơ đồ trang của bạn đến Google
Bạn có thể gửi sơ đồ website của mình tới Google Search Console. Từ trang tổng quan (dashboard), click Crawl > Sitemaps > Add Test Sitemap.Nhớ kiểm tra lại sơ đồ trang và xem kết quả trước khi nhấp vào submit để kiểm ra lỗi có thể khiến quá trình lập chỉ mục bị ngăn cản. Lý tưởng nhất là nhận được số trang lập chỉ mục bằng với số trang được gửi.Lưu ý: Bạn thường chọn trang chất lượng cao để gửi đi, nhưng Google không đảm bảo tất cả chúng sẽ được lập chỉ mục.Nhưng cứ gửi đi vì sẽ có lợi ích đấy:
- + Giúp Google hiểu cách trình bày trang
- + Khám phá các lỗi và sửa chữa chúng, đảm bảo đúng cách để Google lập chỉ mục lần sau.
Ưu tiên một số trang chất lượng cao trong sơ đồ trang web
Chất lượng trang web tổng thể là yếu tố quan trọng trong xếp hạng. Nếu sơ đồ trang dẫn đến nhiều trang chất lượng thấp, Google sẽ xem đây không phải là nơi khách truy cập muốn ghé xem. Các trang lý tưởng là:
- + Đã tối ưu cao
- + Bao gồm hình ảnh và video
- + Nội dung độc đáo, hấp dẫn
- + Nhiều đánh giá và nhận xét
Thực hiện phân lập các vấn đề lập chỉ mục
Nếu bạn gửi đi 2000 trang và chỉ có 1500 trang được lập chỉ mục. 500 trang còn lại bạn không biết có vấn đề gì?Điều này thường xảy ra với các trang thương mại điện tử vì nhiều sản phẩm có mô tả giống nhau.Và các chuyên gia SEO khuyên bạn nên cô lập các vấn đề này ra. Khi cô lập, nếu không được index bạn sẽ nhanh chóng và dễ dàng xác định nguyên nhân. Sau đó tiến hành sửa lỗi, không làm ảnh hưởng đến chất lượng trang tổng thể.
Cài đặt riêng phiên bản URLs Canonical trong sitemaps XML
Khi có nhiều trang giống nhau, ví dụ sản phẩm A có 5 màu, bạn nên sử dụng thẻ “link rel=canonical” để cho Google biết trang nào là chính, họ nên thu thập và lập chỉ mục.
Sử dụng Robots Meta Tag trên Robots.txt bất cứ khi nào
Khi không muốn index cho một trang nào đó, bạn thường sử dụng thẻ meta robots “noindex,follow”. Điều này ngăn không cho Google index nhưng vẫn giữ nguyên giá trị của link. Nó đặc biệt hữu ích cho các trang tiện ích của website, trang không kém phần quan trọng nhưng không hiển thị trong kết quả tìm kiếm.
Không sử dụng các URL noindex trong sitemaps
Bạn không thể gửi đi các URL noindex để Google index. Đây rõ ràng là điều thiếu nhất quán, một sai lầm vẫn thường gặp.
Thực hiện tạo mới sitemaps XML động cho các trang lớn
Gần như không thể theo dõi kịp tất cả robot meta trên một trang web khổng lồ. Thay vào đó, bạn nên thiết lập quy tắc xác định một trang có bao nhiêu index, hoặc có thay đổi từ noindex sang index bằng sitemaps XML động cho các trang lớn.
Sử dụng XML Sitemaps & RSS/Atom
Nguồn cấp dữ liệu RSS / Atom thông báo cho các công cụ tìm kiếm khi bạn cập nhật trang hoặc thêm nội dung mới vào trang web của bạn. Google khuyến cáo sử dụng cả sơ đồ trang web và nguồn cấp dữ liệu RSS / Atom để giúp các công cụ tìm kiếm hiểu trang nào nên được lập chỉ mục và cập nhật. Bằng cách chỉ đưa nội dung cập nhật gần đây trong nguồn cấp dữ liệu RSS / Atom của bạn, bạn sẽ tìm thấy nội dung được cập nhật mới dễ dàng hơn cho cả công cụ tìm kiếm và khách truy cập.
Cập nhật những sửa đổi khi có sự thay đổi đáng kể
Đừng cố lừa công cụ tìm kiếm bằng cách cập nhật thời gian sửa đổi nhưng không có bất kỳ thay đổi đáng kể nào cho trang của bạn. Google sẽ nhanh chóng thâu tóm và biết ngay việc cập nhật liên tục mà không cung cấp thêm giá trị mới.
Không nên lo lắng quá nhiều về các cài đặt ưu tiên
Một số sitemaps có cột “Ưu tiên”, nó cho công cụ tìm kiếm thấy trang nào là quan trọng nhất.Cho dù tính năng này thực sự hoạt động nhưng vẫn có nhiều tranh luận. Đầu năm ngoái, Gary Illyes của Google đã viết trên tweet rằng Googlebot bỏ qua cài đặt ưu tiên trong khi thu thập dữ liệu.
Nên giữ cho kích thước file nhẹ nhất có thể
File sitemaps nhẹ giúp bạn bớt căng thẳng khi đặt nó lên máy chủ. Google và Bing đều tăng kích thước các file sitemaps từ 10 MB lên 50 MB vào năm 2016, nhưng giữ file càng nhẹ càng tốt nhất và nên ưu tiên cho các trang đích chính của site.
Thực hiện tạo nhiều Sitemaps nếu site có hơn 50,000 URL
Bạn được giới hạn tối đa 50.000 URL cho mỗi sơ đồ trang web. Số lượng như thế đã đủ cho đa số các website. Tuy nhiên, vẫn có một số web về thương mại điện tử vượt mức URL đó. Nếu vậy, bạn phải tạo một sơ đồ bổ sung nhé.