Was ist ein Canonical Tag?

Ein Canonical Tag im Quellcode einer Webseite signalisiert Suchmaschinen, dass es mehrere Seiten mit identischem oder fast gleichem Inhalt gibt. Canonical Tags dienen demnach der Kennzeichnung und geben Google die Information weiter, welche URL das Original und damit die bevorzugte URL ist.

Dabei wird die Ursprungsseite als kanonische Seite bezeichnet. Der Link wird auf der Seite eingebaut, welche das Duplikat darstellt und soll durch den Link auf das Original verweisen. Bei der mehrmaligen Verwendung von Inhalten, einer Content Syndication, muss im Quellcode semantisch gekennzeichnet werden, woher der Inhalt (Text, Video, Bild) stammt. So bewerten Suchmaschinen diese nicht und Duplikate lassen sich vermeiden.

canonical-tag

Hintergrund zum Canonical Tag

Seit 2009 unterstützt Google das rel-canonical-Element. Auch Yahoo und Microsoft einigten sich auf die Unterstützung des HTML-Tags, sodass Webmaster seither Duplikate markieren können. Für Website-Betreiber brachte die Einführung des Canonical-Tags Erleichterung im Kampf gegen Duplicate Content. Gleichzeitig profitieren auch Suchmaschinen wie Google davon. Die ständige Arbeit der Crawler und Bots ist sowohl finanziell als auch zeitlich aufwändig. Seiten mit Canonical Tag erhalten nicht so eine hohe Beachtung von den Crawlern, werden nicht indexiert und somit können Ressourcen eingespart werden. 

Wann wird ein Canonical Tag eingesetzt?

Kommen Canonical Tags zum Einsatz, wird Duplicate Content – also doppelter Inhalt – verhindert. Dies ist vor allem in Webshops nötig und wird dort oft genutzt, um eine Abstrafung durch Suchmaschinen wie Google oder Bing zu vermeiden. Dabei scannt der Crawler die Seite, erkennt einen Canonical Tag und weiß, dass es sich um eine Kopie handelt und ignoriert sie. Das Canonical Tag ist für den Crawler ein eindeutiges Zeichen dafür, welcher Inhalt der relevantere ist und vermeidet Fehler beim Bewerten der Seite. 

Auch technischer Duplicate Content, der durch die Abrufbarkeit einer Webseite unter mehreren Varianten entsteht, kann durch Canonical Tags vermieden werden. Webseiten, die also mit und ohne www, http und https abgerufen werden können, sollten immer auf eine bevorzugte Version zeigen. Im Optimalfall wird dies jedoch nicht über Canonicals geregelt, sondern sollte über Weiterleitungen an die richtige Domainversion in der .htaccess eingerichtet werden.Eine Webseite sollte grundsätzlich im Optimalfall immer nur über eine Version abrufbar sein.

Canonical Tags kommen oft zum Einsatz in:

  • Online Shops, in denen das gleiche Produkt in verschiedenen Farben und Größen angeboten wird
  • Blogs, in denen dieselben Inhalte in mehreren Kategorien veröffentlicht werden
  • Pressemitteilungen, die Content der Webseite sind und ebenfalls als PDF-Dokument verfügbar sind

Wie füge ich einen Canonical Tag hinzu?

Das Canonical Tag wird im Head-Element oder im http-Antwort-Header auf der Seite hinzugefügt, die eine Kopie des Originals ist. 

Wer den Quellcode der Inhaltsseite nutzen möchte, gibt einfach folgenden Code im HEAD-Bereich oder den HTTP-Header ein:

				
					<link rel==”canonical” href==”http://www.beispiel.de/original-url”/>
				
			

Je URL kann nur ein Canonical ausgelesen werden. Finden sich im Quellcode mehrere Canonical Tags, wird dies von Google ignoriert und häufig nur die erste Angabe berücksichtigt. 

Über das WordPress Plugin Yoast SEO kann die kanonische URL – also die Original-Seite – allerdings auch ganz einfach hinterlegt werden. Hier muss lediglich auf „Seiten“, eine Seite ausgewählt, auf „Bearbeiten“ geklickt und unter „Yoast SEO“ bei „Erweitert“ die Original-URL eingetragen werden.

yoast-seo-canonical-tag

Canonical Tags einsetzen: Was muss beachtet werden?

Wer Canonical Tags korrekt einsetzen möchte, sollte folgendes beachten:

  1. Liegt Duplicate Content vor, den ich vermeiden will?
  2. Die Canonical URL darf keine 404 Fehlerseite sein. Es gilt zu überprüfen, ob das Original noch existiert.
  3. Die URL muss die exakte Bezeichnung sein, ein fehlender oder zusätzlicher Slash kann Fehler verursachen
  4. Tragen Sie nicht mehrere Canonical URLs ein. Google ignoriert dann alle und behandelt die Seite wie eine, die keinen Tag enthält.
  5. Für Canonical URLs sollten nur absolute URLs genutzt werden.
  6. Es ist zu überprüfen, ob in der kanonischen URL keine disallow, nofollow oder noindex Attribute vorhanden sind.
  7. Bedenken Sie, dass die Seite, die den Canonical Tag erhält, nicht indexiert wird!
  8. Machen Sie sich Gedanken darüber, ob die kanonische URL diejenige ist, die auch in den Suchergebnissen erscheinen soll.

Übrigens: Der gleichzeitige Einsatz von Canonical Tags und dem noindex-Attribut wirkt sich negativ auf die SEO der Ursprungsseite aus. Denn während das Canonical Tag besagt, dass zwei Seiten identisch sind, besagt das Attribut, dass die Seite nicht indexiert werden soll. Wenn einer Kopie das Attribut noindex zugewiesen wird, wird auch das Original nicht indexiert.

Häufige Fehler bei der Implementierung

Diese Fehler können zu immensen Problemen mit der Indexierung und der Suchmaschinenoptimierung führen: 

  • Verwendung im <body>: Wenn das Canonical-Tag im <body> anstatt im <head> platziert wird, hat er keine Wirkung und wird von Google ignoriert.
  • Canonical bei Paginierung: Wenn das Canonical auf die erste Seite einer paginierten Serie verweist, ignoriert Google alle paginierten Seiten, was zu falschen Duplikatmeldungen führt.
  • Verwendung von relativen URLs: Das Canonical funktioniert nur zuverlässig mit absoluten URLs, da die Suchmaschine sonst nicht weiß, auf welche Domain sich die Kanonisierung bezieht.
  • Canonical auf fehlerhaften Seiten: Wenn der Canonical-Link auf eine Kategorie-Seite verweist, die einen 404-Fehler ausgibt, sollte er auf eine erreichbare URL zeigen.
  • Falsches Protokoll: Das Canonical-Tag sollte das gleiche Protokoll wie die kanonische Seite verwenden, um Fehler zu vermeiden, wie das Verweisen auf eine URL mit HTTP anstelle von HTTPS.

Was sind selbstreferentielle Canonical Links?

Selbstreferentielle Canonical-URLs verweisen auf ihre eigene URL – auf sich selbst. Reguläre Canonical-URLs weisen vom Duplikat auf das Original.

Beispiel einer Canonical-URL für eine Landingpage:

Wenn ein Websitebetreiber eine spezifische Landingpage für Google Ads erstellt, die sehr ähnliche Inhalte wie eine bereits indexierte Seite hat, wird die Canonical-URL eingesetzt. Diese hilft dabei, Google zu signalisieren, welche der beiden Seiten als Hauptseite (Original) bevorzugt behandelt werden soll.

  • Originalseite: https://www.beispiel.de/seo/
  • Google Ads-Seite: https://www.beispiel.de/seo-landingpage/

Hierbei erhält die Google Ads-Seite die Original-URL als Canonical-URL, was Google mitteilt, dass die Originalseite die primäre Version ist.

Beispiel für eine selbstreferenzielle Canonical-URL:

Auf einer Originalseite wie https://www.beispiel.de/seo/ wird die URL selbst auch als Canonical-URL gesetzt, also https://www.beispiel.de/seo/. 

Es ist ratsam, einen selbstreferenzierenden Canonical-Link zu setzen, da in Zukunft verschiedene URL-Varianten, die erkennbar durch Parameter (https://www.beispiel.de/seo?=1234) in der URL sind, entstehen könnten. Wenn keine selbstreferenzierenden Canonicals eingerichtet werden, besteht das Risiko, dass diese Parameter-URLs indexiert werden.

Selbstreferentielle Canonical Links sind besonders wertvoll für komplexe Websites, da sie helfen, potenzielle Duplicate Content-Probleme zu vermeiden, die durch die Entstehung von Parametern verursacht werden können.

Was ist, wenn mein CMS oder Shop-System nicht erlaubt, Canonical Tags einzusetzen?

Wenn im genutzten System keine Canonical Tags eingebaut werden können, gibt es weitere Möglichkeiten Google darauf hinzuweisen, dass gleiche Inhalte mehrfach zur Verfügung stehen und deshalb ignoriert werden sollen, um Abstrafungen vorzubeugen. 

Durch das Erstellen einer XML Sitemap mit den wichtigsten, hauptsächlichen URLs wird Google das Signal gegeben, dass diese URLs die kanonischen sind, wenn/falls mehrere Seiten zum selben Content gefunden werden. Wird kein Canonical Tag gesetzt, entscheidet Google anhand von verschiedenen Signalen, bei welcher Seite es sich um das Original handelt und zeigt diese in den Suchergebnissen bei Google an. In der Search Console kann sehr schön verfolgt werden, welche Seiten nicht indexiert wurden. Unter “Alternative Seite mit richtigem kanonischen Tag” und unter “Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt”.

Zusätzlich helfen diese alternativen Methoden, um ähnliche SEO-Vorteile zu erzielen und Duplikatinhalte zu verwalten:

  • 301-Weiterleitungen nutzen, um Besucher und Suchmaschinen von Duplikatseiten auf die bevorzugte URL umzuleiten. 
  • Robots.txt und Meta-Robots-Tag verwenden, um Suchmaschinen das Crawlen bestimmter Duplikatseiten zu untersagen.
  • Sitemap priorisieren und sicherstellen, dass die XML-Sitemap nur die URLs enthält, die indexiert werden sollen.
  • Interne Verlinkung optimieren, damit sich die Link-Popularität auf die bevorzugte Seite konzentriert.
  • Konsistente URL-Strukturüber die gesamte Website hinweg sicherstellen. 
  • Qualität und Einzigartigkeit des Inhalts sicherstellen, um Probleme mit doppelten Inhalten zu mildern.

Canonical Tag vs. Noindex: die Entscheidung bei doppelten Inhalten

Das Canonical Tag und das Noindex Tag sind beide wirksame Lösungen für Duplicate Content Probleme. Während das Canonical Tag jedoch darauf hinweist, dass eine Originalseite existiert und Suchmaschinen die Duplikate weiterhin indexieren können, signalisiert das Noindex Tag, dass die besuchte Seite nicht im Index erscheinen soll. Beide Tags bieten eine Lösung für doppelte Inhalte, aber die Wahl zwischen ihnen hängt davon ab, ob Sie möchten, dass Suchmaschinen die Seite indexieren oder nicht. Nur von einer parallelen Verwendung beider Tags ist abzuraten.

Dieser Artikel wurde verfasst von:
Picture of Emilia Weihmann
Emilia Weihmann
Emilia, unsere Spezialistin für Content, hat bei uns das Ruder in der Hand, wenn es um redaktionelle Angelegenheiten geht. Ihr Steckenpferd ist Content-Marketing, und es überrascht nicht, dass sie besonders gerne zu diesem Thema in unserem Blog schreibt.
Picture of Emilia Weihmann
Emilia Weihmann
Emilia, unsere Spezialistin für Content, hat bei uns das Ruder in der Hand, wenn es um redaktionelle Angelegenheiten geht. Ihr Steckenpferd ist Content-Marketing, und es überrascht nicht, dass sie besonders gerne zu diesem Thema in unserem Blog schreibt.
Inhalts­übersicht