Wiki.

Duplicate Content.

Was ist Duplicate Content?

Duplicate Content bezeichnet sehr ähnliche oder iden­ti­sche Inhalte, die sich über verschie­dene URLs aufrufen lassen. Dabei können dupli­zierte Inhalte zwischen internem und externem Duplicate Content unter­schieden werden. 

Interner Duplicate Content bezieht sich auf Inhalte, die die eigene Website betreffen, wogegen externer Duplicate Content andere Seiten betreffen, die ähnliche Inhalte haben wie die eigene Website.

Der Umgang mit Duplicate Content gehört zu den Haupt­auf­gaben eines Such­ma­schi­nen­op­ti­mie­rers. Diese schaden dem Ranking, da Google Wert auf einzig­ar­tige Inhalte legt. Also ist das kopieren, abschreiben und umschreiben von Content anderer Seiten nicht sinnvoll.

Typische Arten von Duplicate Content

Darum ist Duplicate Content ein Problem

Duplicate Content sorgt für Abstra­fungen in den Rankings der Such­ma­schinen. Der Google Bot kriegt dadurch Probleme zu entscheiden, welche Seite für eine bestimmte Such­an­frage am rele­van­testen ist. Es wird dem Algo­rithmus erschwert, die richtige Seite in den Such­ergeb­nissen anzu­zeigen, sodass es dort auch zu Schwan­kungen der ange­zeigten URLs kommen kann. Dadurch kommt es zur eigenen Keyword Kannibalisierung.

Google ist außerdem bemüht, Seiten mit unter­schied­li­chen Infor­ma­tionen zu crawlen und zu inde­xieren. Sind also Duplikate vorhanden, werden Crawling Ressourcen verschwendet — was Google erkennt und abstraft. Duplicate Content kann durch Tools wie Copyscape und Siteliner (Free) entdeckt werden. Außerdem können Sie zum Beispiel einen ganzen Satz (Text­bau­steine) mit Anfüh­rungs­zei­chen als Such­an­frage eingeben, um Duplikate zu finden.

Duplicate Content vermeiden

Duplicate Content ist in einigen Situa­tionen sinnvoll, wie beispiels­weise in den Produkt­de­tail­seiten eines Webshops. Aller­dings sollten dann Canonical Tags auf den Seiten hinzu­ge­fügt werden, die auf das Original hinweisen. Dadurch ignoriert der Crawler die kopierten Texte, wodurch Duplicate Content vermieden wird.

Um die doppelte Abruf­bar­keit von www, non-www, http und https zu vermeiden, müssen Einträge in der htaccess hinzu­ge­fügt werden. So können Sie zum Beispiel von www. auf non-www weiterleiten:

Rewri­teEn­gine on
Rewri­te­Cond %{HTTP_HOST} ^domain.de
Rewri­te­Rule ^(.*)$ https://domain.de$1 [R=301,L]

Eine weitere Möglich­keit ist das Hinzu­fügen des Meta Tags “noindex”, wodurch Seiten nicht indexiert werden.

Ohne Kommunikation gibts keine Veränderung. Lust auf ein gutes Gespräch?

Welche Möglichkeiten hat dein Unternehmen im Bereich Online Marketing? Wie erreichst du deine Umsatzziele? Lass uns genau das herausfinden und gemeinsam Großes schaffen.