Wiki.

Duplicate Content

Was ist Duplicate Content?

Duplicate Content bezeichnet sehr ähnliche oder identische Inhalte, die sich über verschiedene URLs aufrufen lassen. Dabei können duplizierte Inhalte zwischen internem und externem Duplicate Content unterschieden werden.

Interner Duplicate Content bezieht sich auf Inhalte, die die eigene Website betreffen, wogegen externer Duplicate Content andere Seiten betreffen, die ähnliche Inhalte haben wie die eigene Website.

Der Umgang mit Duplicate Content gehört zu den Hauptaufgaben eines Suchmaschinenoptimierers. Diese schaden dem Ranking, da Google Wert auf einzigartige Inhalte legt. Also ist das kopieren, abschreiben und umschreiben von Content anderer Seiten nicht sinnvoll.

Typische Arten von Duplicate Content

Kopien vom exakt gleichen Inhalt oder großen Teilen des Inhalts
Erreichbarkeit von Inhalten über mehrere Domains oder Subdomains
Verwendung von einer zusätzlichen mobilen Version der Website
Seiten, die mit Klein- und Großschreibung erreichbar sind
Seiten, die mit und ohne Trailingslash erreichbar sind
Eigene URLs für Druckversionen, PDFs
Produktdetailseiten für Varianten (Farbe, Größe) in Online Shops

Darum ist Duplicate Content ein Problem

Duplicate Content sorgt für Abstrafungen in den Rankings der Suchmaschinen. Der Google Bot kriegt dadurch Probleme zu entscheiden, welche Seite für eine bestimmte Suchanfrage am relevantesten ist. Es wird dem Algorithmus erschwert, die richtige Seite in den Suchergebnissen anzuzeigen, sodass es dort auch zu Schwankungen der angezeigten URLs kommen kann. Dadurch kommt es zur eigenen Keyword Kannibalisierung.

Google ist außerdem bemüht, Seiten mit unterschiedlichen Informationen zu crawlen und zu indexieren. Sind also Duplikate vorhanden, werden Crawling Ressourcen verschwendet – was Google erkennt und abstraft. Duplicate Content kann durch Tools wie Copyscape und Siteliner (Free) entdeckt werden. Außerdem können Sie zum Beispiel einen ganzen Satz (Textbausteine) mit Anführungszeichen als Suchanfrage eingeben, um Duplikate zu finden.

Duplicate Content vermeiden

Duplicate Content ist in einigen Situationen sinnvoll, wie beispielsweise in den Produktdetailseiten eines Webshops. Allerdings sollten dann Canonical Tags auf den Seiten hinzugefügt werden, die auf das Original hinweisen. Dadurch ignoriert der Crawler die kopierten Texte, wodurch Duplicate Content vermieden wird.

Um die doppelte Abrufbarkeit von www, non-www, http und https zu vermeiden, müssen Einträge in der htaccess hinzugefügt werden. So können Sie zum Beispiel von www. auf non-www weiterleiten:

RewriteEngine on
RewriteCond %{HTTP_HOST} ^domain.de
RewriteRule ^(.*)$ https://domain.de$1 [R=301,L]

Eine weitere Möglichkeit ist das Hinzufügen des Meta Tags “noindex”, wodurch Seiten nicht indexiert werden.

Ohne Kommunikation gibts keine Veränderung. Lust auf ein gutes Gespräch?

Welche Möglichkeiten hat dein Unternehmen im Bereich Online Marketing? Wie erreichst du deine Umsatzziele? Lass uns genau das herausfinden und gemeinsam Großes schaffen.