Thẻ canonical là gì? Tổng hợp các kiến thức về thẻ canonical.

Hiểu cách sử dụng đúng cách chuẩn hóa và đặt URL chuẩn là kiến ​​thức cần thiết đối với bất kỳ SEO nào và việc triển khai sai những điều này có thể gây ra các vấn đề phổ biến ảnh hưởng tiêu cực đến hiệu suất trang web của bạn.

Thẻ Canonical lần đầu tiên được giới thiệu vào năm 2009 để giúp quản trị viên web khắc phục nội dung trùng lặp hoặc rất giống nhau có thể truy cập được trên nhiều URL.

Thẻ canonical là gì
Thẻ canonical là gì?

Nhưng để sử dụng thẻ canonical đúng cách, bạn cần hiểu chúng là gì, cách chúng hoạt động và cách triển khai chúng.

Thẻ canonical là gì?

Thẻ canonical (hay còn gọi là “rel canonical”) là cách tốt nhất để cho các công cụ tìm kiếm biết bạn muốn lập chỉ mục URL nào. Thẻ chuẩn hoặc phần tử liên kết chuẩn cho các công cụ tìm kiếm biết rằng bản sao chính của trang tồn tại. Thẻ hợp quy là một cách hiệu quả để tránh nội dung trùng lặp; khi nội dung tương tự tồn tại trên nhiều URL, trang chuẩn cho biết URL nào quan trọng hơn để Google biết URL nào cần lập chỉ mục.

Do đó, việc sử dụng đúng các thẻ chuẩn là điều cần thiết cho SEO, vì nó cho Google biết URL nào nên được lập chỉ mục và giúp giải quyết vấn đề nội dung trùng lặp.

Thẻ canonical là gì?
Code sample

Cấu trúc thẻ canonical ?

Các thẻ hợp quy sử dụng cú pháp đơn giản và nhất quán và được đặt trong phần <head> của trang web:

Thẻ canonical là gì
Cấu trúc thẻ Canonial

<link rel = “canonical” href = “https://example.com/sample-page/” />

Dưới đây là ý nghĩa của từng phần của các mã trên bằng tiếng Anh:

  1. link rel = “canonical”:  Liên kết trong thẻ này là phiên bản chính (chuẩn) của trang này.
  2. href = “https://example.com/sample-page/”:  Bạn có thể tìm thấy phiên bản chuẩn tại URL này.

Vì sao các thẻ canonical lại quan trọng đối với  SEO?

Google không đồng ý nội dung trùng lặp. Nó khiến họ khó lựa chọn hơn:

Thẻ canonical là gì
Công dụng của thẻ Canonical trong SEO là gì?
  1. Phiên bản nào của trang cần lập chỉ mục (họ sẽ chỉ lập chỉ mục một trang!)
  2. Phiên bản nào của trang để xếp hạng cho các truy vấn có liên quan.
  3. Liệu họ có nên hợp nhất “liên kết công bằng” trên một trang hay chia nó thành nhiều phiên bản.

Quá nhiều nội dung trùng lặp có thể ảnh hưởng lớn đến “ngân sách thu thập thông tin” của bạn. Điều đó có nghĩa là Google sẽ phải mất thời gian để thu thập thông tin của nhiều nội dung của cùng một trang thay vì khám phá các nội dung quan trọng khác trên trang web của bạn.

XEM THÊM:  File robot.txt là gì? Hướng dẫn cách sử dụng robots.txt trong SEO

Vì sao việc chuẩn hóa lại quan trọng?

Nội dung trùng lặp là một chủ đề phức tạp, nhưng khi các công cụ tìm kiếm thu thập thông tin nhiều URL có nội dung giống hệt nhau (hoặc rất giống nhau), nó có thể gây ra một số vấn đề về SEO. Đầu tiên, nếu trình thu thập thông tin tìm kiếm phải xem qua quá nhiều nội dung trùng lặp, chúng có thể bỏ sót một số nội dung độc đáo của bạn.

Thứ hai, sự trùng lặp quy mô lớn có thể làm loãng khả năng xếp hạng của bạn. Cuối cùng, ngay cả khi nội dung của bạn có xếp hạng, các công cụ tìm kiếm có thể chọn sai URL làm “ban đầu”. Sử dụng chuẩn hóa giúp bạn kiểm soát nội dung trùng lặp của mình.

Tại sao nội dung trùng lặp tồn tại

Trước khi chúng tôi xem xét lý do tại sao bạn nên sử dụng URL chuẩn và cách chỉ định những URL này trên các CMS phổ biến nhất ‘, bạn cần hiểu lý do tại sao nội dung trùng lặp lại tồn tại ngay từ đầu. Không ai bắt đầu tạo nội dung trùng lặp trong một trang web.

Thông thường, điều này xảy ra khi hệ thống quản lý nội dung tạo nhiều URL khi bạn khởi chạy một trang, khi bạn có các phiên bản khác nhau của trang web có thể lập chỉ mục, có phiên bản thay thế cho các loại thiết bị khác nhau hoặc sử dụng URL động.

Hãy xem các URL sau và giả định rằng, đối với người dùng, tất cả chúng đều hiển thị chính xác cùng một nội dung:

  1. https://www.website.com/category/product-a/
  2. https://www.website.com/product-a/
  3. https://website.com/product-a/
  4. http://www.website.com/product-a/
  5. http://website.com/product-a/
  6. https://m.website.com/product-a/
  7. https://www.website.com/product-a
  8. https://www.website.com/product-A/

Đối với công cụ tìm kiếm, đây không phải là một trang nội dung, nó là tám trang trùng lặp:

  • URL # 1 và # 2 xuất hiện do CMS lưu URL sản phẩm có và không có tên danh mục.
  • URL # 3, # 4 và # 5 là kết quả của việc trang web có thể truy cập được cả trên phiên bản HTTP và HTTPS, cũng như phiên bản www và không phải www.
  • URL # 6 là phiên bản thân thiện với thiết bị di động nằm trên một miền phụ.
  • URL # 7 là phiên bản không có dấu gạch chéo của URL # 2.
  • URL # 8 sử dụng chữ ‘A’ viết hoa thay cho chữ thường được sử dụng ở những nơi khác trên trang web.

Bạn cũng có thể thấy nội dung trùng lặp tồn tại trên các URL như:

  • https://www.website.com/
  • https://www.website.com/index.php

Trên thực tế, nhiều trang web có những vấn đề này mà bạn thậm chí không nhận ra, nhưng URL chuẩn giúp các công cụ tìm kiếm xác định các biến thể khác nhau của một trang dưới dạng một URL duy nhất.

Sự cố có thể xảy ra với URL

Bạn có thể nghĩ “Tại sao mọi người lại sao chép một trang?” và giả định sai rằng chuẩn hóa không phải là điều bạn phải lo lắng. Vấn đề là chúng ta, là con người, có xu hướng coi một trang như một khái niệm, chẳng hạn như trang chủ của bạn. Tuy nhiên, đối với các công cụ tìm kiếm, mỗi URL duy nhất là một trang riêng biệt.
Ví dụ: trình thu thập thông tin tìm kiếm có thể truy cập trang chủ của bạn theo tất cả các cách sau:

  • http://www.example.com
  • https://www.example.com
  • http://example.com
  • http://example.com /index.php
  • http: //example.com /index.php?r …
XEM THÊM:  Schema là gì? Hướng dẫn tạo Schema chi tiết từ A đến Z

Đối với con người, tất cả các URL này đại diện cho một trang duy nhất. Tuy nhiên, đối với trình thu thập thông tin tìm kiếm, mỗi một trong số các URL này là một “trang” duy nhất. Ngay cả trong ví dụ giới hạn này, chúng ta có thể thấy có năm bản sao của trang chủ đang hoạt động. Tuy nhiên, trên thực tế, đây chỉ là một mẫu nhỏ về các biến thể mà bạn có thể gặp phải.

Hệ thống quản lý nội dung hiện đại (CMS) và các trang web động, chạy bằng mã còn làm trầm trọng thêm vấn đề. Nhiều trang web tự động thêm thẻ, cho phép nhiều đường dẫn (và URL) đến cùng một nội dung và thêm thông số URL cho các tìm kiếm, sắp xếp, tùy chọn tiền tệ, v.v. Bạn có thể có hàng nghìn URL trùng lặp trên trang web của mình và thậm chí không nhận ra điều đó.

Các phương pháp hay nhất về thẻ Canonical

Các vấn đề về nội dung trùng lặp có thể cực kỳ phức tạp, nhưng đây là một số điều quan trọng cần xem xét khi sử dụng thẻ chuẩn:

1. Các thẻ hợp quy có thể tự tham chiếu

Sẽ ổn nếu thẻ chuẩn trỏ đến URL hiện tại. Nói cách khác, nếu các URL X, Y và Z là trùng lặp và X là phiên bản chuẩn, bạn có thể đặt thẻ trỏ đến X trên URL X. Điều này nghe có vẻ hiển nhiên, nhưng đó là điểm nhầm lẫn phổ biến.

2. Chủ động chuẩn hóa trang chủ của bạn

Do các bản sao trang chủ rất phổ biến và mọi người có thể liên kết đến trang chủ của bạn theo nhiều cách (mà bạn không thể kiểm soát), bạn nên đặt một thẻ chuẩn trên mẫu trang chủ của mình để ngăn ngừa các sự cố không lường trước được.

Thẻ canonical là gì?
Trang chủ moz.com có ​​một thẻ chuẩn tự tham chiếu.

3. Kiểm tra ngay các thẻ chuẩn động của bạn

Đôi khi mã không hợp lệ khiến một trang web viết một thẻ chuẩn khác nhau cho mọi phiên bản của URL (hoàn toàn thiếu toàn bộ điểm của thẻ chuẩn). Đảm bảo kiểm tra ngay các URL của bạn, đặc biệt là trên các trang web thương mại điện tử và CMS.

4. Tránh các tín hiệu hỗn hợp

Các công cụ tìm kiếm có thể tránh một thẻ chuẩn hoặc diễn giải nó không chính xác nếu bạn gửi các tín hiệu hỗn hợp. Nói cách khác, không chuẩn hóa trang A -–> trang B rồi đến trang B -–> trang A. Tương tự, không chuẩn hóa trang A -–> trang B rồi chuyển hướng 301 trang B -–> trang A. Nói chung cũng không phải là ý kiến ​​hay để xâu chuỗi các thẻ chuẩn (A -–> B, B -–> C, C –-> D), nếu bạn có thể tránh nó. Gửi tín hiệu rõ ràng, hoặc bạn buộc các công cụ tìm kiếm đưa ra những lựa chọn tồi.

5. Hãy cẩn thận chuẩn hóa các bản sao gần giống nhau

Khi hầu hết mọi người nghĩ đến chuẩn hóa, họ nghĩ đến các bản sao chính xác. Có thể sử dụng thẻ chuẩn trên các trang gần như trùng lặp (các trang có nội dung rất giống nhau), nhưng hãy tiến hành một cách thận trọng.

Có rất nhiều cuộc tranh luận về chủ đề này, nhưng nhìn chung, bạn có thể sử dụng thẻ chuẩn cho các trang rất giống nhau, chẳng hạn như trang sản phẩm chỉ khác nhau theo đơn vị tiền tệ, vị trí hoặc một số thuộc tính sản phẩm nhỏ. Hãy nhớ rằng các phiên bản không chuẩn của trang đó có thể không đủ điều kiện để xếp hạng và nếu các trang quá khác nhau, công cụ tìm kiếm có thể bỏ qua thẻ.

XEM THÊM:  Spam backlink là gì? Cách tránh spam backlink trong SEO hiệu quả

6. Hợp chuẩn hóa các bản sao tên miền chéo

Nếu bạn kiểm soát cả hai trang web, bạn có thể sử dụng thẻ chuẩn trên các miền. Giả sử bạn là một công ty xuất bản thường xuất bản cùng một bài báo trên nửa tá trang web.

Sử dụng thẻ chuẩn sẽ tập trung sức mạnh xếp hạng của bạn chỉ trên một trang web. Hãy nhớ rằng quá trình chuẩn hóa sẽ ngăn các trang web không chuẩn hóa xếp hạng, vì vậy hãy đảm bảo việc sử dụng này phù hợp với trường hợp kinh doanh của bạn.

Thẻ Canonical với 301 Redirects

Một câu hỏi thường gặp về SEO là liệu các thẻ chuẩn có vượt qua giá trị liên kết (Xếp hạng trang, Cơ quan, v.v.) như chuyển hướng 301 hay không. Trong hầu hết các trường hợp, họ có vẻ như vậy, nhưng đây có thể là một câu hỏi nguy hiểm. Hãy nhớ rằng hai giải pháp này tạo ra hai kết quả rất khác nhau cho trình thu thập thông tin tìm kiếm và khách truy cập trang web.

Nếu bạn chuyển hướng 301 Trang A -> Trang B, thì người truy cập sẽ tự động được đưa đến Trang B và không bao giờ thấy Trang A. Nếu bạn chuyển hướng trang A -> Trang B, thì các công cụ tìm kiếm sẽ biết rằng Trang B là chuẩn, nhưng mọi người sẽ có thể truy cập cả hai URL. Đảm bảo rằng giải pháp của bạn phù hợp với kết quả mong muốn.

Cách kiểm tra các thẻ hợp quy của bạn cho SEO

Khi kiểm tra các thẻ chuẩn của bạn, có một số điều cần kiểm tra để có hiệu suất SEO tối ưu. Đây là danh sách kiểm tra:

  • Trang có thẻ chuẩn không?
  • Trang chuẩn có trỏ đến đúng trang không?
  • Các trang có thể thu thập thông tin và lập chỉ mục không?

Một lỗi phổ biến là trỏ trang chuẩn đến một URL bị robots.txt chặn hoặc được đặt thành “noindex”. Điều này có thể gửi các tín hiệu hỗn hợp và khó hiểu đến các công cụ tìm kiếm. Dưới đây là một số cách phổ biến để kiểm tra và kiểm tra các thẻ chuẩn của bạn.

1. View-source

Trong hầu hết các trình duyệt, bạn có thể nhấp chuột phải để xem nguồn hoặc chỉ cần nhập nó vào thanh địa chỉ, như sau: view-source: https: //moz.com/learn/seo/cano … mã nguồn, tìm kiếm thẻ canonical trong <head>. Nếu hiện tại, nó sẽ trông như thế này:Thẻ canonical là gì

2. Sử dụng MozBar

Các MozBar là một thanh công cụ SEO miễn phí mà sẽ dễ dàng cho bạn thấy những thẻ kinh điển trên bất kỳ trang web nào. Sau khi cài đặt, chỉ cần nhấn vào tab Phân tích trang, sau đó nhấp vào “Thuộc tính chung” để xem bất kỳ thông tin chuẩn nào.Thẻ canonical là gì

3. Kiểm tra hàng loạt với Giải pháp phần mềm

Hầu hết các phần mềm kiểm tra trang web SEO đều cho phép bạn kiểm tra hàng loạt các thẻ chuẩn. Moz Pro kiểm tra các thẻ chuẩn bị thiếu và có thể làm như vậy cho 100 nghìn trang cùng một lúc.Thẻ canonical là gì

Nguồn tham khảo:

https://moz.com/learn/seo/canonicalization

https://ahrefs.com/blog/canonical-tags/

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

ƯU ĐÃI DỊCH VỤ backlink 4 400x300