Was ist Duplicate Content?
Duplicate Content bezeichnet sehr ähnliche oder identische Inhalte, die sich über verschiedene URLs aufrufen lassen. Dabei können duplizierte Inhalte zwischen internem und externem Duplicate Content unterschieden werden.
Interner Duplicate Content bezieht sich auf Inhalte, die die eigene Website betreffen, wogegen externer Duplicate Content andere Seiten betreffen, die ähnliche Inhalte haben wie die eigene Website.
Der Umgang mit Duplicate Content gehört zu den Hauptaufgaben eines Suchmaschinenoptimierers. Diese schaden dem Ranking, da Google Wert auf einzigartige Inhalte legt. Also ist das kopieren, abschreiben und umschreiben von Content anderer Seiten nicht sinnvoll.
Typische Arten von Duplicate Content
- Kopien vom exakt gleichen Inhalt oder großen Teilen des Inhalts
- Erreichbarkeit von Inhalten über mehrere Domains oder Subdomains
- Verwendung von einer zusätzlichen mobilen Version der Website
- Seiten, die mit Klein- und Großschreibung erreichbar sind
- Seiten, die mit und ohne Trailingslash erreichbar sind
- Eigene URLs für Druckversionen, PDFs
- Produktdetailseiten für Varianten (Farbe, Größe) in Online Shops
Darum ist Duplicate Content ein Problem
Duplicate Content sorgt für Abstrafungen in den Rankings der Suchmaschinen. Der Google Bot kriegt dadurch Probleme zu entscheiden, welche Seite für eine bestimmte Suchanfrage am relevantesten ist. Es wird dem Algorithmus erschwert, die richtige Seite in den Suchergebnissen anzuzeigen, sodass es dort auch zu Schwankungen der angezeigten URLs kommen kann. Dadurch kommt es zur eigenen Keyword Kannibalisierung.
Google ist außerdem bemüht, Seiten mit unterschiedlichen Informationen zu crawlen und zu indexieren. Sind also Duplikate vorhanden, werden Crawling Ressourcen verschwendet – was Google erkennt und abstraft. Duplicate Content kann durch Tools wie Copyscape und Siteliner (Free) entdeckt werden. Außerdem können Sie zum Beispiel einen ganzen Satz (Textbausteine) mit Anführungszeichen als Suchanfrage eingeben, um Duplikate zu finden.
Duplicate Content vermeiden
Duplicate Content ist in einigen Situationen sinnvoll, wie beispielsweise in den Produktdetailseiten eines Webshops. Allerdings sollten dann Canonical Tags auf den Seiten hinzugefügt werden, die auf das Original hinweisen. Dadurch ignoriert der Crawler die kopierten Texte, wodurch Duplicate Content vermieden wird.
Um die doppelte Abrufbarkeit von www, non-www, http und https zu vermeiden, müssen Einträge in der htaccess hinzugefügt werden. So können Sie zum Beispiel von www. auf non-www weiterleiten:
RewriteEngine on
RewriteCond %{HTTP_HOST} ^domain.de
RewriteRule ^(.*)$ https://domain.de$1 [R=301,L]
Eine weitere Möglichkeit ist das Hinzufügen des Meta Tags „noindex“, wodurch Seiten nicht indexiert werden.