Wann ist Duplicate Content eigentlich Duplicate Content?

YouTube · 4. Jan 2021 12:21

Duplicate Content bedeutet, dass die Inhalte verschiedener Seiten identisch oder zumindest weitgehend identisch sind. Das ist für Google aus mehreren Gründen ein Problem:

Google will jedem Nutzer die bestmöglichen Suchergebnisse liefern und es unbedingt vermeiden doppelten Inhalt anzuzeigen. Schließlich sind Platz und Geduld knapp.

Das Crawlen und Identifizieren von Duplicate Content erfordert einen hohen Ressourcenaufwand.

Für Google ist es eine große Herausforderung algorithmisch zu analysieren und zu entscheiden, welche Seite einer Domain den relevantesten Content zur Suchanfrage liefert, um diese dann zu ranken.

In einem gewissen Umfang ist Duplicate Content aus meiner Sicht ganz normal. Hier versucht Google nach bestem Wissen und Gewissen eine sinnvolle Entscheidung zu treffen.

Duplicate Content meint zudem nicht nur das Klauen von fremdem Content, wie viele oft annehmen. Es geht dabei auch und vor allem um deine eigene Website. Du hast ein Problem mit Duplicate Content, sobald Google sich nicht entscheiden kann, welche deiner Seiten zu einer Suchanfrage relevanter ist und platziert werden soll. Google wird in diesem Fall nicht alle Seiten platzieren, sondern eher keine, oder zumindest keine der Versionen in den Top 10.

Google ist mittlerweile sehr gut darin Duplicate Content zu erkennen. Gary Illyes, ein Webmaster Trends Analyst von Google, hat vor einiger Zeit sehr detailliert geschildert, wie die Suchmaschine vorgeht, um doppelte Inhalte zu finden und zu bewerten.

Google vergleicht Texte nicht in ihrer gesamten Länge, sondern reduziert sie auf eine Prüfsumme. Das spart Ressourcen und macht sie leicht vergleichbar. Insgesamt sind an dem Prozess mehrere Algorithmen beteiligt. Einer kann zum Beispiel sogenannte Boilerplate Content erkennen und entfernen. Darunter fallen zum Beispiel Navigation und Footer, die auf allen Seiten gleich sind.

Alle Inhalte, die Google als Duplicate Content identifiziert hat, werden zu einem Dupe Cluster zusammengefasst. Aus diesem Cluster wird anhand von mehr als 20 Signalen ein Dokument ausgewählt, das letztlich rankt. Diesen Prozess nennt man Kanonisierung.

Mit einem Canonical Tag kannst du Suchmaschinen übrigens selbst mitteilen, welche Seite sie nehmen sollen. Das Canonical Tag ist eins dieser Auswahlsignale. Die Qualität des Inhalts, der PageRank, die HTTPS-Verschlüsselung und die Präsenz in einer Sitemap wären weitere.

Das bedeutet, dass du durchaus einen gewissen Einfluss darauf hast, welche deiner Seiten Google für die Suchergebnisse auswählt.

Ein weiteres Learning aus diesen Informationen ist, dass Google Duplicate Content anhand der Wörter und nicht anhand der Bedeutung bewertet. Das heißt, dass umgeschriebene oder übersetzte Texte nicht als doppelter Inhalt klassifiziert werden.

Duplicate Content führt eigentlich selten zur Abstrafung und wenn doch, dann man schon vieles falsch machen. Meist führt Duplicate Content schlicht zu dem Problem, dass Google nicht erkennt, welche Version die relevantere ist und infolgedessen keine der Versionen gut in den Suchergebnissen platziert. Genau aus diesem Grund solltest du darauf achten, dass du nicht mehr "Kopien" anbietest, als unbedingt nötig.

Ich wünsche allen Mitglieder/innen ein frohes neues Jahr uns alles Gute für 2021.

Liebe Grüße, Eren.

4. Jan 2021 13:07

seopt hat geschrieben: ↑4. Jan 2021 12:21 Duplicate Content meint zudem nicht nur das Klauen von fremdem Content, wie viele oft annehmen.

Meist ist es nichtmal ein Klauen, sondern bewusste Benutzung fremder Texte, ohne darüber nachzudenken, ob das überhaupt sinnvoll ist.

Typisches Beispiel sind Artikelbeschreibungen.
Viele Händler kopieren diese Texte 1:1 von ihrem Großhandel / Hersteller, oder bekommen diese über eine Schnittstelle bzw Datei zur Verfügung gestellt. Die Nutzung solcher "Fertig-Texte" ist natürlich bequem und sehr einfach, aber oft haben innerhalb kurzer zeit mindestens 10 verschiedene Shops eine gleiche Beschreibung und schon hat man das Problem.

Habe das gerade in einem betreuten Shop, die genauso vorgehen.
Beim Anlegen neuer Artikel werden die Herstellertexte häufig wortgleich übernommen, Artikel ranken entsprechend bescheiden - suboptimal.
Sobald ich die Artikel vernünftig ausbaue, ihnen also einen einzigartikel Text (optimiert auf oft gesuchte passende Keywords) verpasse, dazu eine einladende Metadescription usw, rührt sich plötzlich was. Natürlich ist das viel Arbeit, aber wer bei den Suchmaschinen sichtbar sein möchte, ohne dauerhaft in bezahlte Werbung zu investieren, kommt um eigene Beschreibungen kaum drumherum.

Wann ist Duplicate Content eigentlich Duplicate Content?

Wann ist Duplicate Content eigentlich Duplicate Content?

Re: Wann ist Duplicate Content eigentlich Duplicate Content?

Wer ist online?