Thuật toán Google Penguin: Hướng dẫn toàn tập bản cập nhật

Google Penguin (Google Penguin Algorithm) là một thuật toán chống spam của Google, được tạo ra nhằm ngăn chặn các hành vi spam backlink (Link Schemes) và nhồi nhét từ khóa (Keyword Stuffing) để tăng nhanh thứ hạng website mình trên bảng xếp hạng kết quả tìm kiếm tự nhiên.

Năm 2012, Google đã chính thức ra mắt bản cập nhật thuật toán webspam trên mạng, trong đó có mục tiêu cụ thể là spam liên kết và thực hành xây dựng liên kết thao túng.

Thuật toán webspam được biết đến qua bản cập nhật là thuật toán Penguin thông qua một thông báo từ Matt Cutts – người từng đứng đầu nhóm webspam của Google. Mặc dù Google chính thức đặt tên là thuật toán Google Penguin, nhưng không có thông tin chính thức việc này đến từ đâu. Nhiều người cho rằng thuật toán Panda và Penguin xuất phát từ cùng một kỹ sư chủ chốt.

Trước thuật toán Penguin, khối lượng liên kết đã đóng một phần lớn hơn trong việc xác định điểm số của trang web khi được thu thập, lập chỉ mục và phân tích bởi Google. Điều này có nghĩa là khi xếp hạng các trang web theo điểm này thì một số trang web chất lượng thấp và có các nội dung rời rạc lại được ưu tiên ở thứ hạng cao hơn. Chính vì vậy, dịch vụ SEO không còn đơn giản là hơn kém ở backlink mà còn cần đầu tư tối ưu các yếu tối checklist seo nhiều nhất có thể.

Tại sao Google Penguin lại thực sự cần thiết

Cuộc chiến của google với các nội dung chất lượng thấp nhằm mục đích tăng trải nghiệm người dùng được bắt đầu với thuật toán Panda và Penguin và ngày càng được cải thiện với nhiều tính năng mới.

Google Penguin chính là phản ứng mạnh mẽ của google với việc các SEO mũ đen lợi dụng kỹ thuật xây dựng các liên kết trong website nhằm thao túng kết quả tìm kiếm và thứ hạng.

Phát biểu tại hội nghị SMX Advanced, Cutts nói: “Chúng tôi phải làm ra một cái gì đó để giải quyết những thứ liên quan đến nội dung thấp đang tràn lan hiện nay. Nó bắt đầu với Panda và sau đó chúng tôi nhận thấy rằng vẫn còn nhiều ‘rác’, Penguin được thiết kế để giải quyết vấn đề đó”.

Mục tiêu của thuật toán nhằm giành quyền kiểm soát lớn hơn và giảm hiệu quả của các SEO mũ đen.

Bằng cách hiểu rõ hơn và xử lý các loại liên kết trang web và quản trị trang web đã kiếm được, Penguin đã hoạt động để đảm bảo rằng các liên kết trong bài viết tự nhiên sẽ lên TOP công cụ tìm kiếm còn những liên kết spam thì chắc chắn sẽ bị đánh tụt thứ hạng.

XEM THÊM:  [BẢN CHẤT] về cơ chế tìm kiếm của Google

Penguin chỉ giao dịch với một trang web liên kết đến, google chỉ nhìn vào các liên kết trỏ đến website đang đề cập mà không nhìn vào các liên kết đi từ tất cả các trang web đó.

Tham khảo:

  • Cấu trúc Silo là gì? Cấu trúc silo hiệu quả đánh bại website đối thủ

Tác động của Google Penguin

Khi Google Penguin lần đầu tiên ra mắt vào tháng 4 năm 2012, nó đã ảnh hưởng đến hơn 3% kết quả tìm kiếm. Penguin 2.0, bản cập nhật thứ tư (bao gồm cả lần khởi chạy đầu tiên) cho thuật toán đã được phát hành vào tháng 5 năm 2013 và ảnh hưởng đến khoảng 2,3 % kết quả của các truy vấn.

Google Penguin
Google Penguin

Các bản cập nhật mới của Google Penguin

Đã có một số cập nhật và làm mới cho thuật toán Google Penguin kể từ khi nó được tung ra thị trường năm 2012 và có một số điều chỉnh, cũng như cập nhật thuật toán chưa biết.

1. Google Penguin 1.1: ngày 26 tháng 3 năm 2012

Đây không phải là một thay đổi đối với thuật toán, nhưng lần đầu tiên làm mới dữ liệu trong hệ thống.

2. Google Penguin 2.0: Ngày 22 tháng 5 năm 2013

Đây là phiên bản tiên tiến hơn về mặt kỹ thuật của thuật toán Penguin và đã thay đổi cách thuật toán tác động đến kết quả tìm kiếm.

Penguin 2.0 đã tác động đến khoảng 2,3% các truy vấn tiếng Anh, cũng như các ngôn ngữ khác theo tỷ lệ tương ứng. Đây được xem như bản cập nhật Penguin đầu tiên nhìn sâu hơn trang chủ của trang web và các trang danh mục cấp cao nhất để tìm bằng chứng về spam liên kết được chuyển đến trang web.

3. Google Penguin 2.1: Ngày 4 tháng 10 năm 2013

Lần làm mới duy nhất của Penguin 2.0 (2.1) đến vào ngày 4 tháng 10 năm 2013.. Với lần thay đổi này, nó ảnh hưởng đến khoảng 1 phần trăm truy vấn.

Mặc dù không có lời giải thích chính thức từ Google, dữ liệu cho thấy việc làm mới dữ liệu 2.1 cũng nâng cao mức độ sâu của Penguin nhìn vào trang web và thu thập sâu hơn và tiến hành phân tích sâu hơn về việc liệu các liên kết spam có được chứa trong nội dung hay không.

4. Google Penguin 3.0: Ngày 17 tháng 10 năm 2014

Lần cập nhật này, google làm mới dữ liệu cho phép những người bị ảnh hưởng bởi lần cập nhật trước đó có thể khôi phục trong khi một số SEO mũ đen tiếp tục sử dụng sử dụng các liên kết spam và thoát ra khỏi radar theo dõi của google

Googler Pierre Far cũng tuyên bố rằng bản cập nhật này ảnh hưởng ít hơn 1 phần trăm các truy vấn tìm kiếm bằng tiếng Anh.

5. Google Penguin 4.0: Ngày 23/9/2016

Gần hai năm sau khi làm mới 3.0, bản cập nhật thuật toán Penguin cuối cùng đã được tung ra. Sự thay đổi lớn nhất với lần lặp này là Penguin trở thành một phần của thuật toán cốt lõi.

Khi thuật toán vượt qua để trở thành một phần của lõi, điều đó không có nghĩa là chức năng thuật toán đã thay đổi hoặc có thể thay đổi đáng kể một lần nữa. Thực tế chúng có nghĩa là nhận thức của Google về thuật toán đã thay đổi, chứ không phải chính thuật toán.

XEM THÊM:  [ Tổng hợp] 7 Kỹ Năng Cần Thiết Khi Học Thiết Kế Website

Thuật toán hạ cấp Google Penguin

Một trang web bị ảnh hưởng bởi Penguin và mất 17 tháng để nâng.
Một trang web bị ảnh hưởng bởi Penguin và mất 17 tháng để nâng.

Ngay sau khi thuật toán Penguin bắt đầu được chạy, các website sử dụng kỹ thuật xây dựng liên kết thao túng hoặc lấp đầy hồ sơ backlinks với số lượng lớn các liên kết chất lượng thấp bắt đầu thấy lượng traffic và xếp hạng sụt giảm nghiêm trọng.

Một trang web bị ảnh hưởng bởi Penguin và mất 17 tháng để nâng.

Tác động của Penguin có thể vượt qua giữa các tên miền, do đó, việc thay đổi tên miền và chuyển hướng tên miền cũ sang tên miền mới có thể gây ra nhiều vấn đề hơn về lâu dài.

Nhiều nghiên cứu chỉ ra rằng việc sử dụng chuyển hướng 301 hoặc 302  sẽ loại bỏ tác dụng của Penguin và trong Diễn đàn quản trị trang web của Google, John Mueller đã xác nhận rằng việc sử dụng meta refresh từ một tên miền sang một tên miền mới cũng có thể gây ra các biến chứng.

Muller nói: “Chúng tôi khuyên bạn không nên sử dụng chuyển hướng loại làm mới meta vì điều này có thể gây nhầm lẫn với người dùng”.

Phục hồi Google Penguin

Từ khi Penguin ra đời, những người làm SEO phải hạn chế tối đa các thủ thuật. Nhiều nghiên cứu chỉ ra rằng, việc từ chối các liên kết không thực sự làm bất cứ điều gì để giúp hạ cấp thuật toán dựa trên liên kết. Tuy nhiên, lý thuyết này đã bị google lập tức phản bác.

Google đưa ra gợi ý rằng nên sử dụng công cụ từ chối để xử lý những link spam, bởi việc từ chối một liên kết sẽ dễ dàng hơn rất nhiều việc gửi yêu cầu xem xét lại các liên kết tốt.

Những gì có trong một tập tin bị chối bỏ

Tệp từ chối là một tệp bạn gửi đến google để thông báo rằng bạn bỏ qua tất cả các liên kết có trong tệp để chúng không có bất cứ tác động nào trên trang web của bạn. Kết quả là các liên kết phủ định sẽ không còn gây ra sự cố xếp hạng tiêu cực với trang web của bạn, chẳng hạn như với Penguin, nhưng điều đó cũng có nghĩa là nếu bạn đưa nhầm các liên kết chất lượng cao vào tệp từ chối của mình, các liên kết đó sẽ không còn giúp website của bạn thăng hạng trên google.

Bạn cũng không cần bao gồm bất kỳ ghi chú nào trong tệp từ chối của mình, trừ khi chúng hoàn toàn dành cho bạn tham khảo. Nó là tốt chỉ bao gồm các liên kết và không có gì khác nữa.

Từ chối các liên kết cá nhân so với tên miền

Tốt nhất bạn nên từ chối các liên kết ở cấp tên miền thay vì từ chối các liên kết riêng lẻ. Sẽ có một số trường hợp bạn muốn từ chối các liên kết cụ thể riêng lẻ chẳng hạn như trên một website lớn có sự kết hợp giữa các liên kết chất lượng được trả tiền.

Nhưng đối với phần lớn các liên kết, bạn có thể từ chối dựa vào tên miền. Google chỉ cần thu thập dữ liệu một trang trên trang web đó để liên kết đó được trỏ về trang web của bạn.

XEM THÊM:  Meta Description là gì? 15 cách viết thẻ Meta chuẩn SEO 2024

Tìm kiếm các backlink website của bạn

Nếu bạn nghi ngờ trang web của mình đã bị ảnh hưởng tiêu cực bởi Penguin, bạn cần thực hiện kiểm các backlink trên website của bạn ngay lập tức để loại bỏ những backlink spam, kém chất lượng.

Google Search Console bao gồm danh sách các liên kết ngược cho chủ sở hữu trang web, nhưng lưu ý rằng nó cũng bao gồm các liên kết đã được theo dõi. Nếu liên kết được nofollowed, nó sẽ không có bất kỳ tác động nào đến trang web của bạn, nhưng hãy nhớ, trang web có thể xóa nofollow đó trong tương lai mà không cần cảnh báo.

Ngoài ra còn có nhiều công cụ của bên thứ ba sẽ hiển thị các liên kết đến trang web của bạn, nhưng vì một số trang web chặn các bot của bên thứ ba đó thu thập dữ liệu trang web của họ, nó sẽ không thể hiển thị cho bạn mọi liên kết trỏ đến trang web của bạn. Và trong khi một số trang web chặn các bot này là các trang web nổi tiếng chất lượng cao không muốn lãng phí băng thông trên các bot đó, thì nó cũng đang được một số trang web spam sử dụng để che giấu các liên kết chất lượng thấp của chúng khỏi bị báo cáo.

Tham khảo: Backlink Dofollow – Nofollow là gì? Nên sử dụng Dofollow hay Nofollow?

Cách thức loại bỏ liên kết xấu

Google khuyên bạn nên cố gắng tiếp cận với các trang web và quản trị trang web nơi các liên kết xấu bắt nguồn từ đầu tiên và yêu cầu xóa chúng trước khi bạn bắt đầu nhận cảnh báo từ google.

Một số chủ sở hữu trang web yêu cầu một khoản phí để loại bỏ một liên kết. Google khuyến nghị không bao giờ trả tiền cho việc xóa liên kết. Thay vào đó, chỉ cần đưa các liên kết đó vào tệp chối bỏ của bạn và chuyển sang loại bỏ liên kết tiếp theo.

Đánh giá những liên kết chất lượng

Nhiều người gặp khó khăn trong việc đánh giá một liên kết chất lượng hay không. Đừng cho rằng một liên kết đến từ một trang web .edu thì có chất lượng cao. Rất nhiều sinh viên bán các liên kết từ các trang web cá nhân của họ trên các tên miền .edu cực kỳ spam và bị từ chối. Tương tự như vậy, có rất nhiều trang web bị tấn công trong các tên miền .edu có liên kết chất lượng thấp.

Cảnh giác với các liên kết từ các trang web được cho là chất lượng cao

Đừng xem danh sách các liên kết và tự động coi các liên kết từ các trang web cụ thể là một liên kết chất lượng tuyệt vời, trừ khi bạn biết rằng liên kết rất cụ thể có chất lượng cao. Chỉ vì bạn có một liên kết từ một trang web lớn như Huffington Post hoặc BBC cũng có thể không tạo ra một liên kết chất lượng cao trong mắt Google.

Bài viết liên quan: 

Xem thêm: [ Tăng Traffic lên 10 lần, Tăng doanh thu đột phá ] https://hapodigital.com/dich-vu-seo/

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

ƯU ĐÃI DỊCH VỤ backlink 4 400x300