Startseite >> Blogbeiträge >> SEO Blogbeiträge
Dich interessiert, was Duplicate Content (DC) ist, wie Google damit umgeht und was du bei DC auf deiner Webseite tun kannst? Dann bist du hier genau richtig. Dann sehen wir uns das ganze mal genauer an!
Was dich in diesem Blogbeitrag erwartete:
- Was bedeutet Duplicate Content?
- Warum Duplicate Content problematisch ist
- Beispiele für Duplicate Content
- Wie finde ich doppelte Inhalte?
- Wie du Duplicate Content vermeidest
- Content Pruning
- Ist Kannibalisierung Duplicate Content?
Was bedeutet Duplicate Content?
Duplicate Content (doppelter Inhalt) sind Inhalte, welche identisch auf mehreren Seiten im Internet vorkommen. Das kann nur auf deine eigene Webseite beschränkt sein (interner Duplicate Content) oder auch auf die anderer (externer Duplicate Content). Dabei werden eher komplette Seiten mit gleichem Inhalt anstatt einzelner Textpassagen gemeint. Damit deine Seiten auch gut ranken können, brauchst du eine Menge „Unique Content“, also einzigartige Inhalte. Das bedeutet, dass diese Inhalte speziell für diese Seite erstellt wurden und nur dort existieren.
Warum Duplicate Content problematisch ist
Vorab: Auf fast jeder Webseite lässt sich Duplicate Content in der ein oder anderen Art finden. Es kommt dabei darauf an, um welche Art doppelter Inhalte es sich handelt. Hast du bspw. eine Webseite mit Kategorie und Paginierung, hast du die Seiten „www.beispiel.de/kategorie/?p=1“, „[…]/?p=2“ etc. Das kannst du einfach mithilfe von robots.txt (noindex,follow) oder canonicals (rel=“prev“ oder rel=“next“) steuern. Gibst du in auf deiner Webseite wichtige, wiederholende rechtliche Angaben an, wirkt sich das nicht negativ auf das Ranking aus.
Anders sieht es bei Keyword-Spam oder Scraping aus. Scraping ist das bewusste kopieren, speichern und exakte wiederverwenden fremder Inhalte. Werden diese von Google erkannt, wird die Webseite sofort heruntergestuft und abgestraft. Passiert es weiterhin und öfter, kann die Webseite komplett aus dem Index von Google entfernt werden.
Damit lässt sich also sagen: es kommt immer auf die Art von doppelten Inhalten an. Bei wichtigen Informationen ist es normal und wird von Google nicht weiter beachtet. Wird es aber als Instrument für Manipulation verwendet, werden Abstrafungen von Google eingeleitet werden.
Beispiele für Duplicate Content
Es gibt auf vielen Webseiten doppelte Inhalte, ohne das der Betreiber etwas davon mitbekommen kann. Das können von einfachen bis inhaltlich selbstverständlichen Inhalten reichen:
- URL / Protokoll -> deine Webseite kann unter www. und ohne erreichbar sein. Das gleiche gilt für das Aufrufen mit HTTP und / oder HTTPS.
- Deine Webseite zieht um -> Bist du dabei, deine Domain umzuziehen, kann es zu doppelten Inhalten kommen. Der Grund ist recht einfach: der Crawler hat bereits die Inhalte der neuen Domain angesehen. Zeitgleich ist aber noch deine alte Webseite im Index und wird als Duplicate Content angesehen.
- Parameter, Tags, Paginierung etc. -> Wie vorher bereits erwähnt, kann es bei der Paginierung ohne Einstellungen zu doppelten Inhalten kommen. Das selbe gilt aber auch bspw. bei Suchergebnissen, Suchen durch Tags etc.
- URL-Parameter und Session-IDs -> Ist in deiner URL eine Session-ID oder URL Parameter enthalten? Dadurch entsteht wahrscheinlich auch doppelter Inhalt. Die IDs sind sinnvoll für das Tracken und Herkunft von Nutzern. Diese solltest du aber nach Möglichkeit aus der URL entfernen, um deinen Rankings nicht zu schaden.
- Groß- und Kleinschreibung -> Durch die verschiedenen Schreibweisen entstehen ebenfalls einzigartige URLs. Aus diesem Grund empfehle ich dir, von Anfang an dich für ein Format zu entscheiden und daran festzuhalten. So kannst du einzigartige Inhalte auf deiner Webseite besser ranken lassen.
- Identische oder ähnliche Produktbeschreibungen -> Viele Webshops übernehmen die Produktbeschreibung vom Hersteller. Das Problem dabei: es entsteht eine Menge externer doppelter Inhalt. Die Metadaten machen dann kaum einen Unterschied. Wenn bei Farbvarianten automatisch die selbe Produktbeschreibung hinterlegt wird, ranken diese Produkte schlechter. Daher solltest du dafür sorgen, dass dabei nur die Grundvariante indexiert werden kann.
- Printversion einer Seite -> Wenn du Nutzern die Möglichkeit gibst, Inhalte auszudrucken, kann es auch zu doppelten Inhalten führen. Verwende dabei keine eigene URL, sondern ein Parameter mit einem canonical auf die vorherige Seite. So erkennt Google, dass es eine gewollte Kopie darstellt.
Wie finde ich doppelte Inhalte?
Es gibt, wie fast immer, mehrere Möglichkeiten, doppelte Inhalte ausfindig zu machen.
- Du kannst von einer dir relevanten Seite eine wichtige Textpassage kopieren und bei Google in Anführungszeichen („) als Suche eingeben. Gibt es viele Ergebnisse, dann wird es davon Duplikate geben.
- Das kostenlose Tool Siteliner scannt deine Webseite nach internen Duplikaten, defekten Links etc. Dafür musst du einfach nur den Link deiner Webseite eingeben und schon geht es los.
- Ein weiteres kostenloses Tool ist Textguard. Dabei fügst du einen Text ein und lässt es dann auf Plagiate prüfen. Sollte es sich um ein Plagiat handeln, schreibt das Tool dir den Text sogar direkt mit um. So erhältst du einen plagiatsfreien Text, welcher den ursprüngliche n Sinn beibehält. (Getestet habe ich das Tool aber nicht. Mir stellt sich da nur die Frage, ob das ganze nicht fast das selbe Ergebnis hat wie ChatGPT.)
- Auch in der Google Seach Console (GSC) lässt sich ein ähnliches Tool zur Prüfung finden. Unter dem Punkt „Index“ > „Abdeckung“ kannst du ausgeschlossene Seiten mit dem Typ Duplikat finden. Da zeigt dir Google an, welche Seiten als ähnlich empfunden werden.
- Aber auch (teilweise) kostenpflichtige Tools wie Screaming Frog, SISTRIX, SEMrush oder Ahrefs analysieren dein Webseite. Screaming Frog checkt dabei die gesamte Webseite. Die weiteren Tools haben sogar die Möglichkeit, einzelne URLs prüfen zu lassen. Das kann besonders bei der Überprüfung besonders wichtiger URLs helfen, gezielter deine gewünschten Ergebnisse zu erzielen.
Wie du Duplicate Content vermeidest
Es gibt auch hier wieder eine Vielzahl an Möglichkeiten, um Duplicate Content zu vermeiden. Natürlich solltest du am Anfang immer darauf achten, Unique Content zu erstellen. Also keine Inhalte kopieren, sondern diese selbst verfassen und mit wertvollen Bildern, Videos etc. untermalen. Hast du gewollte Duplikate (bspw. wichtige rechtliche Informationen), dann verwende dabei canonical Tags. So gibst du Google klare Signale, was auf deiner Seite Original ist und was kopiert wurde.
Bei ähnlichen und veralteten Inhalten kannst du auch 301-Weiterleitungen nutzen. Nutze die aber nur für sinnvoll ähnliche Inhalte und nicht für Seiten, welche du von den Rankings boosten möchtest. Das wird Google erkennen, aber dich eher nach unten als oben stufen. Wenn du weniger wichtige, aber dennoch notwendige Seiten mit doppelten Inhalten hast, nutze dafür einen noindex-Tag. Google überspringt die Indexierung dieser Seite, aber deine Nutzer sehen trotzdem den relevanten Inhalt dieser Seite. Ein gutes Beispiel dafür sind Loginseiten, bei welchen der Inhalt der Seite irrelevant ist. Für den Nutzer ist diese Seite aber von hoher Bedeutung.
Zusammengefasst lässt sich also sagen:
- Einzigartigen Content erstellen (keine Inhalte anderer Seiten kopieren)
- Canonical Tags bei gewollten Duplikaten verwenden
- 301-Weiterleitungen für ähnliche, aber veraltete Seiten nutzen
- Noindex bei Seiten, welche vom Inhalt irrelevant, für den Nutzer aber von hoher Bedeutung sind (bspw. Loginseiten)
- Verwende eindeutige URLs und vermeide nach Möglichkeit unnötige Parameter (bspw. Session-IDs, Uhrzeiten etc.)
Hast du dir alte Inhalte schon lange nicht mehr angesehen? Dann macht es sicherlich Sinn, dass du Content Pruning betreibst. Dabei schaust du dir veraltete, schlechte performende oder irrelevante Inhalte an, um diese aufzufrischen, zusammenzuführen oder zu löschen. Wichtig: Dieser Prozess ist kein One-and-done, sondern etwas, was du dir mindestens einmal jährlich ansehen solltest.
Content Pruning
Zuerst solltest du dir dabei überlegen, was das Pruning erreichen soll. Sind es Blogbeiträge, Produktseiten, etc. oder alles davon? Die GSC kann dir dabei helfen, einen Fokus für den strategischen Prozess zu setzen. Im nächsten Schritt siehst du dir alle Seiten deiner Webseite an. Screaming Frog kann dir dabei helfen, alle relevanten Informationen kompakt darzustellen. Danach siehst du dir den Traffic der Seiten an. Auch Absprungraten, Verweildauer oder auch anderes Engagement solltest du mit in die Analyse einbeziehen. Backlinks sind auch nicht außer Acht zu lassen, welche du weiterhin behalten möchtest.
Nun schaust du dir deine schwachen Inhalte an:
- Für welche Seiten gibt es seit längerem kaum oder keinen Traffic?
- Sind auf der Seite veraltete oder irrelevante Inhalte zu finden?
- Wo gibt es doppelte oder ähnliche Inhalte?
- Welche Seiten ranken schlecht für deine relevanten Keywords?
- Auf welchen Seiten gibt es eine hohe Absprungrate als auch kurze Verweildauer?
So kanns du nun deine Seiten kategorisieren, um eine Entscheidung zu treffen. Welche Seiten sollen aktualisiert werden? Bei welchen Seiten macht es Sinn, die Inhalte zusammenzuführen? Welche Seiten können vollständig gelöscht werden?
Jetzt kannst du deine Entscheidungen umsetzen. Ähnliche Inhalte führst du mit 301-Weiterleitungen zusammen. So behältst du die Linkstärke bei und verbesserst vielleicht sogar deine Rankings. Alte oder irrelevante Inhalte kannst du mit einem 410-Statuscode aus den Suchmaschinen entfernen. Hast du viele Inhalte, welche gelöscht werden sollen, machst du das am besten nach und nach. So kannst du Ranking-Veränderungen bestimmten Maßnahmen zuordnen. Alte Inhalte frischt du mit neuen Informationen, Optimierungen der Struktur und weiteren Maßnahmen auf. Diese Maßnahmen richtest du parallel auch auf technischer Ebene ein. Dazu gehören auch canonicals und die Aktualisierung der Linkstruktur, damit Nutzer sich auf deiner Seite zurecht finden.
Im letzten Schritt prüfst du regelmäßig deine Ergebnisse den Content Pruning. In der Anfangsphase wird es besonders spannend. Da kannst du am besten prüfen, ob sich deine Maßnahmen wie geplant auswirken. Wenn das nicht der Fall ist, schaust du dir deine KPIs an und passt gegebenenfalls deine Strategie an. So erreichst du die besten Ergebnisse für deine Webseite.
Ist Kannibalisierung Duplicate Content?
Auf meiner Recherche bin ich auch auf diese Frage gestoßen. Die Begriffe liegen schon sehr nah bei einander, waren meine Gedanken dazu. Das bedeutet aber nicht, dass es ein und das selbe ist. Hier ist warum.
Duplicate Content ist nach Definition identischer Inhalt auf mehreren Seiten einer oder mehrerer Webseiten. Kannibalisierung hingegen ist etwas anderes. Dabei handelt es sich um Rankings für gleiche Keywords auf verschiedenen Seiten. Wo der Unterschied zwischen den beiden ist? Der Content auf den beiden Seiten kann verschieden sein und differenzierte Themen behandeln. Google tut sich bei der Entscheidung nur schwer, welche Seite für das Keyword relevanter ist. Der Grund dafür ist, dass beide Seiten die selbe Intention des Nutzers bei der Suche erfüllen.
Duplicate Content wird in der Regel nur einmal in den Suchergebnissen angezeigt. Bei Content mit Kannibalisierung sind jedoch alle Seiten in den Suchergebnissen vorhanden. Die einzelnen Rankings sind jedoch im Großen und ganzen gesehen nicht sehr hoch. Zusammengefasst: Kannibalisierung kann Duplicate Content sein, muss es aber nicht.
Spezielle Fälle von Duplicate Content
Zuletzt möchte ich noch auf einige spezielle Punkte bei Duplicate Content eingehen. Einige davon haben wir uns bereits angesehen, dabei werde ich aber noch etwas ausführlicher drauf eingehen.
Einen Punkt, den ich bereits vorher erwähnt habe, sind rechtliche Informationen auf deiner Seite. Diese sind für den Nutzer von großer Bedeutung. Um zu vermeiden, dass Google diese als Duplicate Content sieht, gibt es verschiedene Möglichkeiten. Versandinformationen und dazugehörige Bedingungen sind am besten unter einer eigenen Seite zu finden. Viele Shops nutzen das bereits und verlinken diese im Footer. Daher sollte kein Text übe diese Informationen im Footer zu finden sein.
Bei Content für den internationalen Bereich kann es besonders im DACH zu Problemen kommen. Der Grund dafür liegt in ähnlichen oder gleichem Content auf Seiten für die bestimmten Länder. Also Deutschland, Österreich und Schweiz. Um hierbei Duplicate Content zu vermeiden, gibt es den „hreflang“- Tag, welchen ich in diesem Blogbeitrag beleuchtet habe. Kurzgesagt werden deine Nutzer aus Österreich auf die Seite .at geleitet anstelle von .de. So teilst du Google auf dem einfachsten Weg mit, welche Seite für welches Land gedacht ist und Duplicate Content vermeidest. Der Tag ist aber hauptsächlich für internationale Player geeignet. Bist du ein eher kleinerer Webseitenbetreiber und hast Content nur in einem Land / einer Sprache, wirst du diesen erstmal nicht nutzen.
Auch kann es zu externen Duplicate Content kommen. Zwei gute Beispiele dafür sind Produktbeschreibungen, welche vom Hersteller 1:1 übernommen werden und Newswebseiten. Bei Presseveröffentlichungen sieht sich Google die Version an, welche zuerst gecrawlt wird. Andere Signale wie Links zu Originalquelle sind aber auch relevant. Hast du eine solche Webseite, die auf Presseartikeln aufbaut, ist das ein wichtiger Punkt für dich. Daher kannst du direkt nach Veröffentlichung bei Google einen Crawl beantragen. So gehst du sicher, dass dein Beitrag der erste ist, der von Google erkannt wird.
Verwendest du die Produktbeschreibung für deinen Shop, welche vom Hersteller geliefert wurden, sieht das anders aus. Hier ist es eher wahrscheinlich, dass deine Seite als Duplikat erkannt wird und eher nicht in den Rankings erscheint. Deine Konkurrenten werden die Beschreibungen unter anderem auch direkt übernehmen, ohne Änderungen zu machen. Daher ist es hierbei wichtig, dass du für diese Produkte einzigartige Beschreibungen erstellst. So hebst du dich von der Masse ab und bist vielleicht sogar in den Rankings ganz vorne dabei.

Schreibe einen Kommentar