Duplicate Content: Ursachen & Lösungen

Was ist Duplicate Content?

Duplicate Content (auf Deutsch doppelter Inhalt) bezeichnet Inhalte, die identisch oder sehr ähnlich unter mehreren verschiedenen URLs erreichbar sind. Suchmaschinen wie Google stehen dann vor der Frage, welche dieser Versionen sie in den Suchergebnissen anzeigen sollen. Da Suchmaschinen den Nutzern möglichst vielfältige und relevante Ergebnisse liefern wollen, mögen sie es nicht, denselben Inhalt mehrfach im Index zu haben.

Wichtig zur Einordnung: Duplicate Content entsteht in den allermeisten Fällen unbeabsichtigt und ist ein technisches Thema, kein moralisches. Trotzdem kann er der Sichtbarkeit schaden, weshalb es sich lohnt, ihn zu verstehen und zu vermeiden.

Der wichtigste Irrtum: die angebliche "Duplicate-Content-Strafe"

Ein hartnäckiger Mythos besagt, Google bestrafe Webseiten für doppelte Inhalte. Das ist in dieser Form falsch und sollte klargestellt werden:

Keine generelle Strafe: Für normalen, unbeabsichtigten Duplicate Content gibt es keine direkte Abstrafung. Google wählt in der Regel einfach eine Version aus, die es für die maßgebliche hält, und zeigt nur diese an. Die übrigen werden herausgefiltert.
Das eigentliche Problem: Der Schaden entsteht also nicht durch eine Strafe, sondern dadurch, dass sich die Bewertungssignale (etwa Backlinks) auf mehrere URLs verteilen und möglicherweise die "falsche" Version rankt.
Wann es doch zur Strafe kommt: Erst wenn Inhalte in manipulativer oder täuschender Absicht massenhaft kopiert werden, etwa um den Index zu fluten oder fremde Inhalte zu stehlen, kann Google das als Spam werten und abstrafen.

Interner und externer Duplicate Content

Man unterscheidet zwei grundlegende Formen:

Interner Duplicate Content: Derselbe Inhalt ist innerhalb der eigenen Webseite unter mehreren URLs erreichbar. Dies ist der häufigste Fall und fast immer ein unbeabsichtigtes, technisches Problem.
Externer Duplicate Content: Inhalte tauchen auf verschiedenen Webseiten auf, etwa wenn Texte von anderen Seiten übernommen werden oder eigene Inhalte von Dritten kopiert wurden.

Häufige Ursachen für Duplicate Content

Gerade interner Duplicate Content entsteht oft durch technische Gegebenheiten, die man leicht übersieht:

www und non-www: Die Seite ist sowohl unter "www.beispiel.de" als auch unter "beispiel.de" erreichbar.
http und https: Beide Varianten liefern denselben Inhalt aus.
URL-Parameter: Filter, Sortierungen oder Tracking-Parameter (etwa ?utm_source=...) erzeugen mehrere URLs mit gleichem Inhalt.
Druckversionen: Eine separate, druckfreundliche Version derselben Seite.
Produktvarianten in Shops: Dasselbe Produkt ist über mehrere Kategoriepfade oder mit unterschiedlichen Parametern erreichbar.
Start-URL mehrfach: Die Startseite ist etwa unter "/" und "/index.html" aufrufbar.

Welche Probleme verursacht Duplicate Content?

Aufgeteilte Signale: Backlinks und Relevanz verteilen sich auf mehrere URLs, statt sich auf einer zu bündeln. Das schwächt die Ranking-Chancen.
Falsche Version im Index: Google könnte eine andere URL anzeigen als die, die man eigentlich ranken lassen möchte.
Verschwendetes Crawling-Budget: Suchmaschinen verbringen Zeit damit, mehrfach denselben Inhalt zu crawlen, statt neue oder wichtige Seiten zu erfassen. Das ist besonders bei großen Webseiten relevant.

Wie vermeidet und behebt man Duplicate Content?

Für die verschiedenen Ursachen gibt es bewährte Lösungen, die du in deinem Glossar teils schon kennst:

Canonical-Tag setzen: Das wichtigste Werkzeug. Er weist Suchmaschinen die bevorzugte Version aus, wenn mehrere ähnliche Seiten erreichbar bleiben sollen.
301-Weiterleitungen einrichten: Wenn eine Version dauerhaft verschwinden soll, etwa die non-www- oder die http-Variante, leitet man sie per 301 auf die maßgebliche URL um.
Auf eine einheitliche Version festlegen: Konsequent entweder mit oder ohne "www" und durchgängig auf "https" setzen.
Konsistente interne Verlinkung: Intern immer auf dieselbe, kanonische URL-Variante verlinken.
Parameter sauber handhaben: Durch Canonical-Tags oder eine durchdachte URL-Struktur verhindern, dass Parameter-URLs als eigenständige Seiten gewertet werden.
Hreflang bei mehrsprachigen Seiten: Bei ähnlichen Inhalten in verschiedenen Sprachversionen hilft das hreflang-Attribut, diese korrekt zuzuordnen, statt sie als Duplikate zu werten.
Eigene, einzigartige Inhalte schreiben: Die nachhaltigste Lösung gegen externen Duplicate Content ist origineller Content statt übernommener Texte.

Ein Hinweis zu Online-Shops

Besonders Online-Shops sind anfällig für Duplicate Content, etwa durch identische oder sehr ähnliche Produktbeschreibungen. Ein häufiger Fall sind Herstellertexte, die viele Shops unverändert übernehmen. Wer hier eigene, einzigartige Produktbeschreibungen verfasst, hebt sich nicht nur von der Konkurrenz ab, sondern vermeidet zugleich externen Duplicate Content und stärkt die eigene Sichtbarkeit.

Fazit

Duplicate Content bezeichnet identische oder sehr ähnliche Inhalte unter mehreren URLs und entsteht meist unbeabsichtigt durch technische Gegebenheiten. Der verbreitete Mythos einer generellen "Duplicate-Content-Strafe" ist falsch: Das eigentliche Problem ist nicht eine Abstrafung, sondern die Aufteilung von Bewertungssignalen und das Risiko, dass die falsche Version rankt. Mit den richtigen Werkzeugen, allen voran dem Canonical-Tag und 301-Weiterleitungen, lässt sich Duplicate Content zuverlässig in den Griff bekommen. Wer zusätzlich auf einheitliche URLs, konsistente interne Verlinkung und einzigartige Inhalte achtet, sorgt für klare Verhältnisse im Index und schöpft das volle Potenzial seiner Seiten aus.