Skip to content

Nội dung trùng lặp là gì? Duplicate Content – adtechjsc

Nội dung trùng lặp là gì? Duplicate Content – adtechjsc

 

Hướng dẫn chi tiết về nội dung trùng lặp, các nguyên nhân gây ra và cách khắc phục triệt để các lỗi do nội dung trùng lặp gây ra – adtechjsc

 

Hiểu đúng về nội dung trùng lặp trên website?

Nội dung trùng lặp (tên tiếng anh là Duplicate Content) là nội dung xuất hiện trên Internet tại hơn một địa chỉ ( URL) hay nói theo một cách khác Duplicata Content là sự xuất hiện của 1 nội dung trên nhiều website khác nhau.

Nội dung trùng lặp là gì? Duplicate Content - adtechjsc
Nội dung trùng lặp sẽ không tốt đối với các website và sẽ khó phát triển
 
Chúng ta sẽ phải hiểu nôm na rằng khi chúng ta tìm một vật gì đó mà có tới 2 cái liên quan, sự phân vân và so sánh để lựa chọn 1 trong 2 (hay nhiều) sản phẩm này sẽ được đưa ra. Vậy đâu là tiêu chí lựa chọn sản phẩm nội dung phù hợp? Chúng ta buộc phải tư duy đến việc chọn lựa đâu là sản phẩm tốt được chọn lựa (nhiều người xem, cách thức trình bày nội dung, phù hợp thẻ tiêu đề, thẻ miêu tả hợp lý… )


Để đưa ra kết quả tìm kiếm tốt nhất, công cụ tìm kiếm sẽ hạn chế hiển
thị các nội dung bị sao chép, vì thế bắt buộc phải lựa chọn phiên bản
nhiều khả năng là bản gốc nhất (hoặc tốt nhất).
 

Ba vấn đề lớn nhất mà một nội dung trùng lặp có thể gây ra:

  1. Search engine (SE) không thể phân biệt phiên bản nào được copy, phiên bản nào là gốc.
  2. SE không biết nên hướng các link metrics (mozrank, moztrust, bản quyền, anchor text, link juice …) đến một trang web, hay giữ tách rời giữa nhiều phiên bản.
  3. SE không biết nên chọn phiên bản nào để xếp hạng cho kết quả tìm kiếm.
Khi
xuất hiện nội dung trùng lặp, người quản trị web đối mặt với vấn đề mất
thứ hạng, giảm traffic, và SE sẽ đưa ra kết quả tìm kiếm kém chính xác
hơn.

 

Nguyên nhân gây trùng lặp nội dung:

Việc nhận diện nội dung trùng lặp không hẳn toàn bộ nội dung và tiêu đề nói cùng một ý, một câu chữ. Các công cụ tìm kiếm đánh giá nội dung trùng lặp thông qua một số yếu tố chính sau:

1. Các tham số của URL

Các thông số URL như theo dõi nhấp chuột và một số mã phân tích có thể gây ra các vấn đề nội dung trùng lặp.

2. Phiên bản in ấn

Các phiên bản để in ấn của một nội dung có thể gây ra duplicate content khi nhiều phiên bản của trang được xếp hạng.

3. Senssion IDs

Các
senssion IDs là nguyên nhân chủ yếu gây ra nội dung trùng lặp. Việc này
xảy ra khi mỗi người dùng vào website và để lại 1 senssion ID và được
lưu lại ở URL.

4. Copy nội dung:

  • Trùng lặp hoàn toàn: Là trường hợp rõ ràng nhất khi nội dung bị sao chép 100% chỉ khác nhau duy nhất là Url.
  • Trùng lặp một phần: Là trường hợp gần giống bản gốc nhất chỉ khác nhau về bố cục, hình ảnh và chút ít về từ ngữ.

  • Cross Domain: Là trường hợp giống 1 phần nội dung, thường là được lấy
    từ bản gốc rồi đăng làm nhiều phần trên những website khác nhau.

 

5. Phân trang comment.

Một
số website khi có lượng comment lớn đã ngắt thành những trang khác nhau
(/cmt-page-1/, /cmt-page-2/) khi cùng trỏ về một nội dung.

6. Non www và www


nhiều SEOer khi không để ý điều này. Vô hình chung đã đẩy website vào
Duplicate Content Website trùng lặp nội dung sẽ bị phạt bởi SE, SE sẽ
loại bỏ (tùy theo mức độ) kết quả tìm kiếm trên trang kết quả đối với
các trang có quá nhiều nội dung trùng lặp nội dung.

>> Các hình phạt có thể xảy ra ở website của bạn?


Các kết quả tìm kiếm của bạn sẽ bị loại bỏ (tùy mức độ xử phạt) trên trang tìm kiếm. Đối
với các trang có quá nhiều nội dung trùng lặp nội dung, website của bạn có thể bị đánh bay khỏi các mạng tìm kiếm… Bạn thử nghĩ xem, mình trồng cây lâu năm đến ngày thu hoạch thì bị chặt gốc sẽ như thế nào? buồn thiệt chứ!

Mới đây (16/12/2013) Matt Cutts người đứng đầu bộ phận hỗ trợ SEO và
chống SPAM của trang mạng tìm kiếm nổi tiếng nhất thế giới Google đã đăng 1 video trên Youtube có nhắc đến việc
trùng lặp nội dung hiện nay. Matt có nói rằng Google không có quyền xử
phạt các trang web có nhiều nội dung trùng lặp, nhưng chắc chắn một điều
rằng những nội dung này sẽ không có thứ hạng cao trên bảng hiện thị kết
quả của Google.

Cách khắc phục triệt để khi bị trùng lặp nội dung

Có rất nhiều cách khắc phục lỗi Duplicate Content, điều quan trọng nhất là chúng ta phải hiểu “làm thế nào để chuyển tải nội dung trên web phù hợp và mang lại lợi ích đến khách hàng. Ngoài những cách khắc phục đối phó với các công cụ tìm kiếm như “chuyển hướng 301, Rel=”canonical”, chúng tôi khuyến cáo các bạn nên dựa trên ý chính và viết nội dung (bàn luận, chỉnh sửa…) theo chính kiến riêng của mình. Nên đặt các câu hỏi hoặc câu cảm thán, đồng thời bỏ lơ, kick thích sự tò mò tới người đọc…
 
Dưới đây là những cách đơn giản khắc phục lỗi noi dung trung lap:
 
  • Chuyển hướng 301

Trong
nhiều trường hợp, cách tốt nhất để chống lại nội dung trùng lặp là
thiết lập một trang chuyển hướng 301 từ trang “bản sao” các trang nội
dung ban đầu. Khi các trang với nhiều khả năng được xếp hạng tốt được
kết hợp thành một trang duy nhất, chúng không còn cạnh tranh với nhau,
mà tạo ra một sự liên quan mạnh mẽ hơn và tín hiệu phổ biến tổng thể.
Điều này sẽ tác động tích cực đến khả năng được xếp hạng tốt trong công
cụ tìm kiếm.
 
  • Rel=”canonical”

Một
tùy chọn khác để đối phó với nội dung trùng lặp là sử dụng rel =
canonical tag. Các rel = canonical đi cùng một link juice (ranking
power) cũng giống như là một chuyển hướng 301, và để thực hiện thì
thường mất it thời gian hơn.

Mẫu code Rel=Canonical:

<link href=”http://www.adtechjsc/about/” red=”canonical”></link>

Dươi đây là thẻ link và tất cả các liên kết, số liệu thống kê được áp dụng thay thế. Đây là thẻ được hiểu là một phần của HTML head trong một trang web. Thẻ meta này không
phải là mới, nhưng như nofollow, chỉ cần sử dụng một tham số rel mới.


dụ:


<link href=”http://www.example.com/canonical-version-of-page/” rel=”canonical”></link>
 

Bản quyền thuộc về adtechjsc.com. Vui lòng trỏ link về bài viết gốc, ghi
rõ nguồn https://www.adtechjsc.com hoặc tên tác giả viết bài nếu các bạn copy bài
viết này

Leave a Reply

Your email address will not be published. Required fields are marked *