Duplicate content: co to jest i jak go uniknąć, aby dobrze pozycjonować markę

29 marca 2023 / Weronika Jurkiewicz

Publikujesz opisy produktów w swoim sklepie internetowym? Jest ich tyle, że decydujesz się dodać jeden tekst do wielu podstron? A może piszesz artykuły i w całości lub we fragmentach udostępniasz je np. w mediach społecznościowych? W każdej z tych sytuacji tworzysz duplicate content. Co to jest, dlaczego lepiej go unikać i w jaki sposób to robić?

Co to jest duplicate content

To inaczej powielanie treści. Ma ono miejsce, kiedy dodajesz ten sam tekst na co najmniej dwóch różnych podstronach swojej domeny lub gdy identyczny content znajduje się na minimum dwóch, innych stronach WWW (np. na Twojej i Twojej konkurencji).

Rodzaje duplikacji treści

Wyróżnia się dwa rodzaje duplikacji treści: wewnętrzną i zewnętrzną. Określają one, w jakim miejscu zachodzi to zjawisko – w obrębie jednej domeny lub w ramach kilku stron WWW.

Wewnętrzna

Wewnętrzne powielanie treści zachodzi wtedy, gdy identyczną treść publikujesz na co najmniej dwóch różnych podstronach w obrębie jednej domeny.

Jakie działania mogą doprowadzić do tego typu duplicate content?

  1. Duplikujesz opisy produktów w swoim sklepie internetowym.
  2. Powielasz pierwszą stronę paginacji, czyli wyświetlasz identyczny opis kategorii w ramach stronicowania (kiedy składa się ona z więcej niż jednej strony, bo zawiera wiele produktów).
  3. Udostępniasz firmową witrynę w języku obcym, ale różne teksty wciąż pojawiają się w polskiej wersji.
  4. Nie korzystasz z przekierowań 301, kiedy pod różnymi adresami URL znajdują się te same treści.
  5. Tworzysz pod innym adresem URL wersję mobilną swojej strony, ale z identycznymi tekstami co na desktopowej, bez stosowania tagów i elementów rel.
  6. Jeden produkt jest przypisany do kilku kategorii, w ramach których otrzymuje różne adresy URL.
  7. Tworzysz sesje użytkownika (aby wybrane przez niego produkty pozostały w koszyku do następnej wizyty). Identyfikatory często przechowuje się w adresie URL, a to sprawia, że powstają nowe, z powieloną treści.
  8. Udostępniasz swoją stronę internetową w wersji do druku pod osobnym adresem i jednocześnie nie korzystasz z tagu noindex

Zewnętrzny

Ten rodzaj duplikacji treści występuje, gdy identyczny content pojawia się na co najmniej dwóch witrynach (np. na Twojej i u konkurencji). 

Z czego wynika takie powielanie treści?

  1. W ramach opisu produktu dodajesz tekst od producenta.
  2. Publikujesz np. artykuł na swoim blogu, a następnie ten sam promujesz w serwisach zewnętrznych.
  3. Tworzysz firmowy content, którego w całości lub fragmentach przekopiowujesz i publikujesz w mediach społecznościowych.
  4. Korzystasz z czyjejś twórczości w ramach prawa cytatu, ale nie oznaczasz odpowiednio tych fragmentów.
  5. Copywriter lub content writer, który projektuje dla Ciebie materiały tekstowe, odsprzedaje je również konkurencji. (Ma do tego prawo, jeśli nie pracuje u Ciebie na etacie lub nie podpisałeś z nim umowę o przekazaniu autorskich praw majątkowych. Tylko ten dokument zapewnia Ci wyłączną licencję).
  6. Kopiujesz i publikujesz content z innych źródeł, bez pozwolenia autora (czyli najprościej mówiąc: dochodzi do kradzieży, która pociąga za sobą również konsekwencje prawne).

Jak wykryć duplicate content

Wiesz już, że duplicate content to kopiowanie i publikowanie treści w kilku miejscach i że występuje w obrębie Twojej domeny, jak i kilku stron WWW. Teraz pora, abyś poznał sposoby jego wykrywania. Gotowy?

Jak wykryć wewnętrzną duplikację treści

Aby w prosty sposób dowiedzieć się, czy masz zduplikowany content w obrębie swojej strony internetowej, skorzystaj operatorów w wyszukiwarce Google.

  1. W oknie wyszukiwania wpisz „site:domena.pl”, gdzie „domena.pl” to adres Twojej strony WWW. W ten sposób otrzymasz listę wszystkich zaindeksowanych podstron.
  2. Aby zawęzić poszukiwania, obok tej komendy możesz dodać konkretną frazę lub fragment tekstu w cudzysłowie, np. „regulowane biurko do małego pokoju”. W ten sposób uzyskasz takie połączenie:

site:twojadomena.pl „regulowane biurko do małego pokoju”

Jak wykryć zewnętrzne powielenie treści

Gdy chcesz sprawdzić, czy konkretny tekst pojawia się na innych stronach WWW, również przyda Ci się wyszukiwarka Google.

  1. Wybierz fragment treści (do ok. 30 słów).
  2. Skopiuj go i wklej do okienka wyszukiwarki.
  3. Na początku i na końcu tekstu wpisz po jednym cudzysłowie (np. „fragment, który wpisujesz do Google’a”). Gdy tego nie zrobisz, w wynikach zobaczysz podobne wyszukiwania, nie identyczne.

Co masz zrobić, kiedy okaże się, że ktoś ma tę samą treść? Postaraj się przygotować własną.

Fragment, który wyszukiwałeś, to część Twojego artykułu? W takiej sytuacji napisz do właściciela firmy i poproś ich o usunięcie tekstu. Za kradzież czyjejś twórczości grozi odpowiedzialność karna (rozdział 14 ustawy o prawie autorskim i prawach pokrewnych).

Jak zapobiec duplicate contentowi

Kiedy już masz świadomość, że duplikacja treści to nic dobrego dla Twojej strony, zapoznaj się z kilkoma sposobami, jak jej uniknąć.

Korzystaj z linków kanonicznych

Masz kilka takich samych lub bardzo podobnych opisów produktów? Wybierz, która z podstron ma być indeksowana. W pozostałych wprowadź linki kanoniczne (rel=”canonical”), czyli meta tagi. Wskazują one robotom Google, który link ma być indeksowany jako oryginalny.

Ustaw przekierowania 301

Znalazłeś podstrony z identyczną treścią? Aby uniknąć duplicate content, ustaw przekierowanie 301 z adresu URL, pod którym kryje się zduplikowany content, do tej, która ma być indeksowana.

Zastosuj meta tag noindex

Gdy wpiszesz meta tag „<meta name=”robots” content=”noindex”>”, roboty Google nie będą pokazywać konkretnej podstrony w wynikach wyszukiwania.

Twórz oryginalne materiały tekstowe

Twórz oryginalne opisy produktów, zamiast dodawać opisy od producentów. Wzbogać je o elementy, o których nie wspomniała konkurencja, i o opinie, fragmenty recenzji użytkowników.

Usuń zduplikowany content

Przejrzyj podobne treści. Jeśli ma to sens – scal je i ustaw przekierowania 301. W innej sytuacji po prostu usuń nadmiarowy, powtarzający się content.

Oznaczaj cytowane fragmenty

Pilnuj, żeby poprawnie oznaczać content, który wykorzystujesz w ramach prawa cytatu. Oznacz autora i (jeżeli pochodzi z internetowego źródła) dodaj link do oryginalnej treści.

Wykorzystasz w tym celu atrybuty:
<blockquote> – aby oznaczyć zakres cytowanego fragmentu,
<cite> – by wskazać źródło, z którego pochodzi.

Duplikacja treści a SEO

Wiesz, jak znaleźć duplicate content, znasz narzędzia, które Ci w tym pomogą, i jak rozwiązać ten problem. Ale dlaczego to wszystko jest tak ważne?

Bo roboty Google mają trudności z indeksowaniem takiej treści. Sprawdzają, na której stronie internetowej content pojawił się jako pierwszy; na jakiej witrynie tekst najpełniej odpowiada na zapytanie z wyszukiwarki. Oceniają również m.in. techniczną optymalizację strony WWW, link building, crawl budget (czyli budżet indeksowania).

Co do zasady Google nie każe powielania treści. Chyba że wyraźnie wskazuje to na próbę „wprowadzenia w błąd i manipulowania wynikami wyszukiwania” (jak wskazują eksperci Google’a) i jest to regularne działanie.

Kary (nie tylko od Google’a) czekają także te firmy, które skopiowały teksty bez zgody ich właściciela.

Jakie mogą być konsekwencje takiego działania? Google obniży pozycję konkretnej podstrony w wynikach wyszukiwania lub usunie ją z indeksu.

Narzędzia do wykrywania duplicate content

Jeśli chcesz odnaleźć na swojej stronie WWW zduplikowaną treść, przede wszystkim skorzystasz ze wspomnianej wcześniej wyszukiwarki Google. Jakie jeszcze narzędzia Ci się przydadzą?

Google Search Console

To m.in. dzięki niemu znajdziesz zduplikowany content na swojej stronie WWW.

W zakresie powielania treści spotkasz się tam z komunikatami:

Alternatywna strona zawierająca prawidłowy tag strony kanonicznej” – występują dwie strony o podobnej lub identycznej zawartości. Na tej, którą Google uznał jako duplikat, został ustawiony link kanoniczny.

Duplikat, użytkownik nie oznaczył strony kanonicznej” – w obrębie domeny wystąpiły powielone podstrony i nie zostały ustawione dla nich linki kanoniczne.

Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik” – mimo tego, że ustawiłeś stronę kanoniczną dla danego adresu URL (lub kilku URL-i), wyszukiwarka wybrała inny, który według niej ma być lepszy.

Copyscape

To narzędzie, z którym sprawdzisz, czy ktoś skopiował i opublikował na swojej stronie internetowej Twoje treści bez zgody.

Screaming Frog

To crawler, czyli program, który zbiera informacje o strukturze i zawartości stron. Jest dostępny w darmowej, jak i płatnej wersji.

Korzystając z udostępnianych przez niego danych, dowiesz się m.in., czy w obrębie Twojej witryny znajdują się zdublowane treści (w tym meta description czy nagłówki H1).

Duplicate content w pigułce

  1. Duplikacja treści (inaczej jej powielanie) to sytuacja, w której podobny lub identyczny content pojawia się na co najmniej dwóch:
    • podstronach domeny (wewnętrzny duplicate)
    • witrynach (duplikacja zewnętrzna).
  2. Aby wykryć zduplikowaną treść, skorzystasz m.in. z wyszukiwarki Google. Wystarczy, że wpiszesz w nią odpowiednie komendy lub fragment tekstu oznaczony cudzysłowami. Otrzymane wyniki dodatkowo dobrze zweryfikować (otworzyć wyświetlone strony i przejrzeć ich zawartość).
  3. Narzędzia przydatne do wykrywania zdulpikowanej treści to również m.in. Google Search Console, Screaming Frog, a do odnajdywania plagiatów – Copyscape.

Weronika Jurkiewicz
Copy, content writerka i korektorka. Za dnia buszuje w słowach i przecinkach, wieczorami – między książkami, łamigłówkami i rękodziełem. Tworzy teksty, w których zagaduje czytelnika (treści idealne do porannej kawy) i roboty Google (content zoptymalizowany pod SEO).