WP: Doppelten Inhalt vermeiden

Jeder der sich ein bisschen mit Suchmaschinenoptimierung beschäftigt weiß, Duplicated Content ist nicht besonders gut für das ranking.

Shoemoney hat vor einigen Tagen darüber berichtet wie man mit ein paar Einträgen in der robots.txt solche doppler vermeidet. In diesem Fall ist die Liste mit Befehlen auf WordPress angepasst, kann aber auch für andere Systeme genutzt werden (evtl. Anpassungen nötig).

Um Google und Co den Zugang zu bestimmten Pfaden zu verbieten muss man folgendes eintragen:

    User-agent: Googlebot

    Disallow: /wp-content/
    Disallow: /trackback/
    Disallow: /wp-admin/
    Disallow: /feed/
    Disallow: /archives/
    Disallow: /sitemap.xml
    Disallow: /index.php
    Disallow: /*?
    Disallow: /*.js$
    Disallow: /*.inc$
    Disallow: /*.css$
    Disallow: */feed/
    Disallow: */trackback/
    Disallow: /page/
    Disallow: /tag/
    Disallow: /category/

    User-agent: Googlebot-Image
    Disallow: /wp-includes/

    User-agent: Mediapartners-Google*
    Disallow:

    User-agent: ia_archiver
    Disallow: /

    User-agent: duggmirror
    Disallow: /

    User-Agent: Googlebot
    Disallow: /link.php
    Disallow: /gallery2
    Disallow: /gallery2/
    Disallow: /category/
    Disallow: /page/
    Disallow: /pages/
    Disallow: /feed/
    Disallow: /feed

Mit dem Kommando “Disallow:” wird der Suchmaschine einfach gesagt das Pfad/Verzeichnis/Datei “X” nicht gelesen werden darf. Anpassungen in der Robots.txt müssen ggf. vorgenommen werden. Natürlich Treffen die Angaben nicht für jedes WordPress System zu.

Informationen über den Autor:

Name: Designpicks Blog
Homepage/Blog: http://www.designpicks.de/
Archiv: Alle Beiträge von Designpicks anzeigen »
Über Designpicks:
Designpicks ist ein deutscher Blog rund um das Thema Webentwicklung und Design.


Kategorie: SEO, Tutorials

Ein Kommentar »

  1. speyburn schreibt: :

    Bevor ich jetzt Duplicate Content erzeuge, schreib ich es um:

    Hab schon in Uwe’s Blog geschrieben, dass mir nicht klar war weshalb die sitemap.xml auch gesperrt wird. Testweise mal bei einem meiner Blogs hochgestellt und schon hat sich Google Webmastertools beschwert dass die Sitemap durch die robots.txt gesperrt wurde :-)
    Die Überraschung hielt sich in Grenzen…
    (hätte ich übrigens auch leicht mit Webmastertools selbst testen können – dafür gibts ja das robots.txt-tool)

    Deshalb würde ich empfehlen: löscht das “Disallow: /sitemap.xml” besser raus.


Kommentar schreiben:


Weitere Beiträge über dieses Thema: