May 23, 2017

Thẻ canonical là gì? Cách tối ưu thẻ canonical trong SEO


Thẻ canonical là gì?

Thẻ Canonical là 1 cách để truyền giá trị của 1 trang cho 1 trang khác mà không phải sử dụng Redirect 301. Canonical được sử dụng trong trường hợp một trang web có thể được truy cập bằng nhiều URL khác nhau. Do Google coi mỗi URL là 1 trang độc lập nên nó chỉ Index 1 URL. Những URL còn lại sẽ không được Index và những giá trị của chúng sẽ không được sử dụng để tăng uy tín và thứ hạng trang đích.

Thẻ Canonical Tag là gì?

Với những nội dung có nhiều URL (ví dụ: http://khuongbui.com ~ http://khuongbui.com/dich-vu-seo), thẻ canonical được đặt trong phần <head> của mã HTML để chỉ cho Google và các Search Engine biết URL nào được Index.

Ví dụ: <link rel=”canonical” href=”http://khuongbui.com” />

Thẻ canonical là gì?

Xem thêm: Tác dụng của thẻ meta rel=”canonical”, tác hại khó lường nếu dùng sai

Thẻ Canonical là công cụ giúp bạn chỉ cho Google biết đâu là URL gốc cần Index. Đồng thời truyền toàn bộ giá trị của những URL không được index sang URL gốc, giúp tăng uy tín và thứ hạng của trang được indexed.

  • Trong thực tế có rất nhiều website gặp phải trường hợp:
  • Khi bạn search Google và click vào trang web –> hiển thị URL1 (indexed)
  • Khi bấm vào menu trên website vào trang web –> hiển thị URL2 (not indexed)
  • Nếu không sử dụng Canonical, link từ trang chủ sẽ không giúp tăng thứ hạng của URL1

Ví dụ sử dụng Canonical với trang web nhiều URL:

  • http://khuongbui.com
  • http://khuongbui.com/
  • http://khuongbui.com/index.html
  • http://www.khuongbui.com
  • http://www.khuongbui.com/index.html

Ngoài việc sử dụng thẻ Canonical, bạn có thể sử dụng Redirect:
Redirect 301 (chuyển nhà vĩnh viễn): truyền giá trị cho trang đích
Redirect 302 (chuyển nhà tạm thời): không truyền giá trị cho trang đích
Sai lầm khi sử dụng Thẻ Canonical
Sử dụng sai URL trang gốc dẫn đến không trang nào được index.
Dùng URL hiển thị trên thanh địa chỉ của trình duyệt đưa vào Canonical, dẫn đến Google không biết trang nào là gốc, vì ai cũng bảo tôi (URL đang hiển thị) là gốc.
Túm lại, Tổng kết Canonical là gì

Canonical Tag nên được sử dụng…
Khi 2 hay nhiều URL có cùng nội dung
Giữa các domain khác nhau
Để thay cho Redirect trong việc xử lý vấn đề trùng lặp nội dung
Để chỉ dẫn nhưng không bắt buộc Search Engine phải theo.
Thẻ Canonical trợ giúp SEO như thế nào?

Chuyên gia Patrick Stox đưa ra khi nào nẻn sử dụng canonical tag, cũng như một số vấn đề phổ biến xảy ra trong quá trình thực hiện.

Trong một thế giới lý tưởng, sẽ chỉ có một phiên bản của mỗi trang. Thế giới quá lộn xộn và cùng một nội dung có thể tồn tại ở nhiều vị trí trên cùng một trang web và các trang web khác. Cách đây nhiều năm, một giải pháp đã được thông qua để giải quyết cho các vấn đề nội dung trùng lặp này: “định dạng thành phần liên kết”, được biết đến như là “rel = canonical” hoặc “canonical tag“.
Thẻ Canonical là gì?

Thuật ngữ Canonical có thể khó hiểu với bạn. Hãy để tôi giải thích điều này bằng những thuật ngữ đơn giản.

Giả sử có hai URL của một trang web:
http://khuongbui.com
http://www.khuongbui.com

Cả hai trang đó đều hiển thị nội dung và không có trang nào chuyển hướng đến bất kỳ trang nào. Điều này có thể dẫn đến vấn đề trùng lặp nội dung trên Google và bạn có thể bị phạt.

Hãy để chúng tôi xem một ví dụ khác. Có hai URL trên một trang web có cùng độ phân giải trang.
http://khuongbui.com
http://khuongbui.com/index.php

Nếu cả hai trang web này đều có cùng kết quả, thì điều này cũng có thể gây ra vấn đề!

Bạn có thể không chú ý nhiều đến vấn đề này, nhưng điều này có thể dẫn đến hình phạt nội dung trùng lặp nghiêm trọng. Vấn đề với công cụ tìm kiếm là không thể tự quyết định phiên bản của URL mà công cụ cần phải thêm vào và lập chỉ mục. Nếu hai trang đang giải quyết cùng một nội dung, và Google sẽ giả định rằng một bản sao là bản sao của trang kia và trang web của bạn sẽ bị phạt.

Nếu trang web của bạn có thể mở 2 URL hiển thị cùng một nội dung, thì bạn phải sửa nó. Bạn phải sử dụng cài đặt máy chủ để người dùng mở với www hoặc non www, trang web sẽ hiển thị 1 phiên bản.

Mặc dù, đôi khi bạn muốn chia sẻ cùng một nội dung trên hai URLS, sau đó bạn có thể sử dụng thẻ rel = “canonical” để cho công cụ tìm kiếm biết đó là bản gốc và cái nào là bản sao của nó. Điều này có thể giúp bạn tránh khỏi bị phạt nội dung trùng lặp.
Thẻ Canonical hỗ trợ SEO như thế nào?

Thẻ Canonical chuẩn giúp giải quyết các vấn đề nội dung trùng lặp bằng cách xác nhận 1 URL chính thức duy nhất, mọi bản sao được Canonical xác nhận về URL chính thức đó. Có thể thấy nhiều vấn đề khác nên phải sử dụng thẻ Canonical như:
https và http
www và non www
index và trang mặc định
Sử dụng phiên bạn mobile hoặc phiên bản AMP
Để thẻ Canonical ở đâu?

Hầu hết chúng ta đều biết rằng bạn có thể sử dụng một thẻ Canonical trong <head>, chẳng hạn như:

<link rel=”canonical” href=”https://example.com/” />

Bạn có thể biết là một thẻ Canonical có thể được đặt trong tiêu đề HTTP là tốt, chẳng hạn như:

HTTP/1.1 200 OK
Link: <https://example.com/>; rel=”canonical”
Thẻ Canonical không hoạt động

Thẻ canonical không phải là một chỉ thị, nghĩa là nó có thể bị bỏ qua. Phiên bản canonical là phiên bản của trang web nên được sử dụng trong các sơ đồ trang, và việc có các URL xung đột trong sơ đồ trang hay trong các liên kết nội bộ (internal link) của bạn có thể đưa ra các tín hiệu lộn xộn.

Các việc khác có thể sai sót, như là sao chép các trang và không thay đổi thẻ canonical hoặc để lại dòng “thay đổi tôi” hoặc “thay thế tôi” trong canonical. Bạn cũng nên sử dụng URL tuyệt đối – không phải tương đối – trong canonical để giúp tránh các lỗi. Những thẻ này và các thẻ canonical sẽ tự định nghĩa và có thể gây ra việc nhiều trang cùng thể hiện với công cụ tìm kiếm rằng chúng là phiên bản ưu tiên. Nếu trang web có nhiều thẻ canonical khác nhau, thì Google sẽ bỏ qua cả hai.

Google sẽ làm gì nếu có các dấu hiệu lộn xộn như nói ở trên? Họ sẽ cố xác định đường dẫn tốt nhất sử dụng các tín hiệu khác nhau như các thẻ canonical, liên kết nội bộ hoặc sơ đồ đường dẫn, và một số yếu tố khác nữa. Ví dụ như họ có thể cố gắng chọn một đường dẫn ngắn hơn so với một đường dẫn dài hơn hoặc chọn HTTPS thay vì HTTP.

Google ưu tiên các trang HTTPS hơn các trang HTTP tương tự nếu trùng nội dung, trừ khi có các tín hiệu xung đột như sau:
Trang HTTPS có chứng chỉ SSL không hợp lệ.
Trang HTTPS có chứa phụ thuộc không an toàn.
Trang HTTPS bị chặn thu thập.
Trang HTTPS chuyển hướng người dùng đến hoặc thông qua trang HTTP.
Trang HTTPS có liên kết rel = “canonical” đến trang HTTP.
Trang HTTPS chứa một thẻ meta robot noindex.

Tương tác của canonical với các thẻ khác

Một thẻ canonical có thể dễ dàng bị sai vì một điều nhỏ nhặt như là lỗi đánh vần hoặc dấu gạch chéo, đặc biệt trong một bộ như đánh số trang hoặc hreflang. Trong các bộ này, việc có một trang khác nhau được lập chỉ mục chứ không phải trang có trong các thẻ sẽ khiến tập hợp các trang đó sẽ không hợp nhất như chúng nên thế, như là việc thiết lập canonical ở trang 2 của một bộ đường dẫn của trang 1. Các thẻ noindex và canonical cũng nên được sử dụng cùng nhau. Tôi đã thấy các trường hợp khi thẻ canonical dường như đưa thẻ noindex tới phiên bản ưu tiên.
Các ứng dụng khác của thẻ canonical

Bạn có biết các thẻ canonical có thể được sử dụng với các tên miền khác nhau? Đây thực sự là một phương cách được ưa chuộng sử dụng khi kiểm soát nội dung. Bạn cũng nên tránh trùng lặp các phiên bản phụ của trang web của bạn, như là phiên bản mobile hoặc các phiên bản AMP. Theo Google thì sắp tới đây bạn sẽ không cần thay đổi các thẻ canonical của mình cho chỉ mục ưu tiên di động.

Các thẻ canonical không cần thiết trong trường hợp hoàn hảo

Trong khi các thẻ canonical hữu ích cho việc tập trung tín hiệu trong nhiều trang, hãy nhớ rằng trong trường hợp hoàn hảo chỉ có một phiên bản duy nhất. Tập trung các trang web với các phương thức khác như chuyển hướng sẽ tốt hơn trong dài hạn, vì bạn có thể hy vọng rằng mình tới được với một phiên bản duy nhất của một trang web.

Trên đây là kiến thức về Canonical tags, ý nghĩa của canonical ảnh hưởng trong SEO như thế nào và cách bạn sử dụng thẻ này đúng cách mang lại hiệu quả thực sự cao. Nếu website của bạn chưa có thẻ Canonical thì hãy nên thêm thẻ này để hạn chế những vấn đề duplicate giữa các page, các phiên bản với nhau…


Biểu tượng cảm xúcBiểu tượng cảm xúc