Was ist Duplicate Content?

Inhalts­übersicht

Duplicate Content, oder doppelte Inhalte, bezeichnet das Vorhandensein identischer oder sehr ähnlicher Inhalte auf mehreren URLs. Dies kann innerhalb derselben Website oder auf verschiedenen Websites auftreten. 


Duplicate Content stellt ein erhebliches Problem für die Suchmaschinenoptimierung dar, weil Suchmaschinen Schwierigkeiten haben, die relevanteste Version der Inhalte auszuwählen. Dies kann zu schlechteren Platzierungen in den Suchergebnissen führen. Für Webseitenbetreiber bedeutet es, dass ihre Sichtbarkeit und Reichweite in Suchmaschinen erheblich beeinträchtigt werden können, was sich negativ auf den Traffic und letztlich auf den Geschäftserfolg auswirken kann. Es wird zwischen internem und externem Duplicate Content unterschieden.

Interner Duplicate Content

Interner Duplicate Content entsteht, wenn identische Inhalte auf mehreren Unterseiten einer Website vorhanden sind, etwa durch die Verwendung gleicher Produktbeschreibungen bei verschiedenen Produktvarianten oder wenn dieselbe Seite unter verschiedenen URLs abrufbar ist, was zu mehreren Versionen derselben Seite führt. Dies kann beispielsweise der Fall sein, wenn eine Website sowohl über „www.beispielseite.de“ als auch über „www.beispielseite.de/index.php“ zugänglich ist.

Diese doppelten, im Content gleichen Seiten, sind ein Problem für Suchmaschinen, weil nicht eindeutig definiert werden kann, welche der Seiten für das fokussierte Keyword ranken soll. Dies wiederum führt zu Einbußen im Ranking für alle Seiten mit dem kopierten Text.

Externer Duplicate Content

Externer Duplicate Content tritt auf, wenn identische oder sehr ähnliche Inhalte auf verschiedenen Websites erscheinen. Dies kann durch Content-Klau oder durch technisch bedingte Fehler entstehen. Ein häufiges Beispiel für externen Duplicate Content ist, wenn eine Websites über mehrere Domainnamen aufrufbar ist, ohne dass 301-Weiterleitungen implementiert wurden. Ohne diese Weiterleitungen sehen Suchmaschinen jede Domain als separate Website an, was zur Bewertung identischer Inhalte auf verschiedenen Domains führt und negative Auswirkungen auf das Ranking haben kann. Durch korrekte Weiterleitungen wird dieses Problem vermieden und die SEO-Leistung verbessert.

Mögliche Klassifizierungen von Duplicate Content

Partial Duplicate Content Near Duplicate Content Exact Duplicate Content
Ein erheblicher Anteil des Inhalts wird auf anderen Websites wiederverwendet Die Inhalte sind nicht direkt kopiert, aber sie ähneln stark dem Text einer anderen Website. Der gesamte Text sowie möglicherweise Grafiken und Bilder sind identisch mit dem Inhalt einer anderen Website.

Tipp: Um Abstrafungen zu vermeiden und die Gesundheit einer Website langfristig zu erhalten, ist es ratsam, zeitnah eine Bereinigung durch eine Suchmaschinenoptimierung vorzunehmen und Inhalte, die sich zu ähnlich sind, zu vermeiden.

So entsteht Duplicate Content

Aus diesen Gründen kommt es zu doppeltem Content:

  • Kopien vom exakt gleichen oder ähnlichen Inhalten
  • Erreichbarkeit von Inhalten über mehrere Domains oder Subdomains
  • Verwendung von einer zusätzlichen mobilen Version der Website
  • Seiten, die mit Klein- und Großschreibung erreichbar sind
  • Seiten, die mit und ohne Trailing Slash erreichbar sind
  • Eigene URLs für Druckversionen, PDFs
  • Produktdetailseiten für Varianten (Farbe, Größe) in Onlineshops
  • Boilerplate Content, welcher auf mehreren Seiten unverändert wiederverwendet wird

Doppelter Content kann auf verschiedene Arten und Weisen entstehen. Wir haben die häufigsten Ursachen zur Entstehung anhand von Beispielen zusammengefasst:

Ursache Beispiel
Website kann mit und ohne www verwendet werden
→ Beide Domains führen zur Zielseite
www.optimerch.de
optimerch.de
HTTP und HTTPS sind beide erreichbar https://optimerch.de
http://optimerch.de
Seite mit Trailing Slash und ohne aufrufbar
→ Hierbei handelt es sich um den Schrägstrich nach einer Domainendung
https://optimerch.de/
https://optimerch.de
Variantenartikel oder Parent-and-Child-Artikel (Parameter)
→ Hierbei wird beispielsweise dieselbe Hose in unterschiedlichen Farben und Größen angeboten
Paginierung
Alternative Versionen sind verfügbar Zusätzliche Druckseiten oder AMP
Entwicklungsumgebungen
  • Eclipse, KDevelop, Visual Studio
  • Websites, welche neu gestaltet werden und eine Development-URL indexiert wird
  • Entwicklungsumgebung sollte immer auf noindex gestellt werden
Schlecht umgesetzte Mehrsprachigkeit Identische Inhalte der gleichen Sprache für unterschiedliche Länder, zum Beispiel für Deutschland und Schweiz.

→Keine Abgrenzung durch Hreflang-Tags im Code der Website
Externe Duplikate durch Kopien
→händisch oder durch (Web-) Scraper
Eigens erstellter Content kann vom Wettbewerber, gänzlich oder auch nur in Teilen, geklaut werden.
Die ist auf zwei Arten möglich:
  • Händisches Copy Paste
  • Scraping → Möglichkeit zur Erstellung einer identischen Kopie einer Website und so der Erleichterung, Content gänzlich kopieren zu können.

So lässt sich Duplicate Content finden

Es gibt verschiedene Möglichkeiten, wie sich Duplicate Content innerhalb der SEO finden lässt:
  • Textelement einer Website als Suchanfrage in Suchmaschine eingeben
  • Regelmäßige Scans mit www.copyscape.com durchführen
  • Rankings dauerhaft im Blick behalten und bei Schwankungen nach Ursachen suchen
  • Suchmaschinenindex regelmäßig prüfen
  • Beachten, ob die Website in den SERPs nur mit URL angezeigt wird und das dazu passende Snippet fehlt
Google strebt danach, Websites mit verschiedenen Informationen zu crawlen und in seinen Index aufzunehmen. Wenn jedoch ähnliche oder gleiche Inhalte vorhanden sind, werden wertvolle Crawling Ressourcen verschwendet. Die Suchmaschine betrachtet Duplicate Content als problematisch, da er für die Nutzer keinen Mehrwert bietet und Google bei der Bestimmung der relevantesten Inhalte behindert. Um Duplicate Content zu finden, stehen Tools wie Copyscape für externe Duplikate und Siteliner (kostenlose Version) für interne Duplikate zur Verfügung.
Sitliner-Analyse Ergebnisbericht

Wichtig zu wissen: Gelegentliche Wiederholungen, wie beispielsweise die Auflistung der Unternehmensvorteile auf verschiedenen Seiten, sind nicht als generell problematisch anzusehen. Jedoch ist es kritisch, wenn ganze Textpassagen kopiert und auf einer anderen Seite wiederverwendet werden.

Tipp: Bei Google kann beispielsweise ein ganzer Satz oder einzelne Textbausteine mit Anführungszeichen als Suchanfrage eingeben werden, um Duplikate zu finden.

In folgendem Beispiel wird der gleiche Text auf zwei verschiedenen Websites verwendet – es handelt sich somit um externen Duplicate Content:

In diesem Beispiel gibt es gleiche Fomulierungen auf mehreren URLs einer Domain, wodurch interner Duplicate Content entsteht:

Im letzten Beispiel wird der gleiche Text nur einmal verwendet:

Darum betrachtet Google Duplicate Content als problematisch

Duplicate Content beeinträchtigt die Bewertung einer Website durch Suchmaschinen, wie beispielsweise Google. Durch doppelten Content ist es für den Googlebot schwerer zu bestimmen, welche Seite bei einer Suchanfrage relevant ist. Zudem ist es für den Algorithmus kaum möglich, die korrekte Website in den Suchergebnissen anzuzeigen, was wiederum zu Schwankungen der angezeigten URLs führt. Dieses Problem tritt besonders bei Exact Duplicate Content und Near Duplicate Content auf und sollte unbedingt vermieden werden.

Tritt das Problem des internen Duplicate Content auf, wirkt sich dies nicht nur unmittelbar auf das Google Ranking aus, sondern steht zudem guten SEO-Ergebnissen im Weg, indem beispielsweise die Linkkraft nicht optimal verteilt wird. Die Verteilung von Links auf mehrere Unterseiten mit doppelten Inhalten kann dazu führen, dass der Linkjuice sich auf mehrere Seiten verteilt, anstatt sich auf eine einzelne URL in Gänze zu konzentrieren. 

Durch das Vermeiden von Duplicate Content und die Zusammenführung zu einer einzigen Unterseite wird die Linkstärke gebündelt, was sich wiederum positiv auf das Ranking in den Suchmaschinen auswirkt. Google versucht, solche Inhalte selbst zu identifizieren und nur die beste Version zu indexieren, doch es wird empfohlen, Duplicate Content aktiv zu vermeiden.

Duplicate Content kann außerdem zur Keyword Kannibalisierung führen, wenn mehrere Seiten für dasselbe Keyword konkurrieren. Die Duplikate verwirren Suchmaschinen bei der Entscheidung, welche Seite die relevanteste ist, und kann zu schlechteren Rankings führen. Statt die Sichtbarkeit zu erhöhen, schwächt es die Gesamtperformance der Website, indem es die Linkkraft und den Traffic auf mehrere Seiten verteilt.

Duplicate Content vermeiden

Bei der Entscheidung, ob alle Website-internen doppelten Texte individualisiert werden können oder ob ggf. Duplicate Content riskiert wird, müssen neben SEO-Aspekten auch ökonomische Aspekte berücksichtigt werden. Es gilt zu überlegen, welche Option in Bezug auf die Ressourcen, Zeit und Kosten besser umsetzbar ist und welche langfristigen Auswirkungen sie auf die SEO-Performance haben könnte. Zudem muss berücksichtigt werden, dass doppelte Inhalte nicht zwangsläufig zu Duplicate Content führen, solange bestimmte Maßnahmen befolgt werden:

  • Canonical Tags: Diese können auf kopierten Seiten hinzugefügt werden und auf die Originalquelle verweisen. Dadurch weiß der Crawler, wo die eigentliche Textquelle ist, wodurch Duplicate Content effektiv vermieden wird.
  • Htaccess-Datei: Um die doppelte Abrufbarkeit von www, non-www, http und https zu vermeiden, müssen Einträge in der htaccess hinzugefügt werden.

    So kann zum Beispiel von www. auf non-www weitergeleitet werden:

    RewriteEngine on
    RewriteCond %{HTTP_HOST} ^domain.de
    RewriteRule ^(.*)$ https://domain.de$1 [R=301,L]

  • NoIndex Tag: Eine Möglichkeit, Duplicate Content zu vermeiden, ist das Hinzufügen des „NoIndex“ Meta Tags. Dadurch wird Google signalisiert, dass die Seite nicht in den Suchergebnissen angezeigt werden soll. Obwohl Google die Seite weiterhin crawlen kann, wird sie nicht in den Suchmaschinenindex mit aufgenommen.

    So kann ein “noindex” im Quelltext für HTML eingepflegt werden:

    <meta name=”robots”
    content=”noindex”>
    in den <head> einpflegen

  • 301-Weiterleitungen: Die 301-Weiterleitung ist eine serverseitige Umleitung, die dauerhaft den Traffic von einer URL zu einer anderen weiterleitet. Der Redirect-Statuscode ist entscheidend, wenn es um die Umstrukturierung von Websites oder die Änderung von URL-Strukturen geht. Dieser teilt Suchmaschinen mit, dass die ursprüngliche Seite nicht mehr existiert und der gesamte Wert auf die neue URL übertragen werden soll. Dies ist entscheidend, um sicherzustellen, dass die Suchmaschinen die neuen Inhalte richtig indizieren und anzeigen können.Um eine 301-Weiterleitung einzubinden, kann dies auf serverseitiger Ebene durch die Konfiguration der .htaccess-Datei (bei Apache-Servern) oder durch serverseitige Skripte wie PHP erfolgen.
    Dabei wird die Syntax Redirect 301 /alte-url “http://www.neue-url.de” genutzt, wobei „alte-url“ durch den Pfad der alten Seite und „http://www.neue-url.de“ durch die Zieldomain ersetzt wird.

Tipp: Bei externem Duplicate Content kann auf zwei Arten vorgegangen werden: Entweder wird die Website kontaktiert, die den Inhalt verwendet und innerhalb des Gesprächs auf die rechtlichen Konsequenzen hingewiesen, oder der eigene Text wird angepasst, wobei dies einiges an Zeit in Anspruch nehmen kann.

Ein ausführlicher Duplicate Content Check ist wichtig, um ähnliche Inhalte nachhaltig zu vermeiden oder diese gar nicht erst entstehen zu lassen.

Fazit

Duplicate Content stellt eine Herausforderung für die Suchmaschinenoptimierung dar. Sowohl interner als auch externer Duplicate Content können zu Rankingverlusten und Sichtbarkeitsproblemen führen. Webseitenbetreiber müssen daher Maßnahmen ergreifen, um doppelte Inhalte zu vermeiden, wie den Einsatz von Canonical Tags und 301-Weiterleitungen. Die regelmäßige Überprüfung und Anpassung der Content-Strategie ist wichtig, um die SEO-Leistung und das Nutzererlebnis zu optimieren.

Dieser Artikel wurde verfasst von:
Picture of Maike Lewark
Maike Lewark
Content Spezialistin Maike vereint Leidenschaft für smarte, hochwertige Inhalte mit einem feinsinnigen Gespür für zielgerichtetes Wording. Umfassendes Know-how und ihr tiefes Verständnis für den redaktionellen Kontext machen sie zu einem wichtigen Teil unseres kreativen Ensembles bei Optimerch.
Picture of Maike Lewark
Maike Lewark
Content Spezialistin Maike vereint Leidenschaft für smarte, hochwertige Inhalte mit einem feinsinnigen Gespür für zielgerichtetes Wording. Umfassendes Know-how und ihr tiefes Verständnis für den redaktionellen Kontext machen sie zu einem wichtigen Teil unseres kreativen Ensembles bei Optimerch.
Inhalts­übersicht