Schlagwort: Suchmaschine

Facebook den Zugriff auf Bilder der Webseite beim Link-Teilen blockieren

Im folgenden Artikel möchte ich erklären wie man bestimmte Dateien auf der eigenen Webseite von der Einbindung auf Facebook ausschließen kann. Warum? Ich möchte nicht, dass die Bilder auf meiner Seite die nichts mit dem verlinkten Artikel zu tun haben, wie das Portrait in der Seitenleiste, neben dem geteilten Link erscheinen. Und es gibt bestimmt noch tausend weitere Gründe, warum man das wollen könnte.

Es geht hier jedoch nicht darum, wie man gezielt Bilder, Titel und Text definiert. Die Möglichkeit dazu bietet das Open Graph Protokoll. Man kann OGP allerdings auch mit einem Trick zum Bilder-Sperren nutzen, dazu am Ende mehr.

Sperren per .htaccess

Im Gegensatz zu Suchmaschinen schauen die Facebook-Server beim Bilder Abrufen nicht in die robots.txt. Daher reicht ein Eintrag dort nicht, sondern man muss den eigenen Server anweisen Facebook aktiv den Zugriff zu sperren. Da die USER-AGENT-Kennung der Facebook-Server immer mit “facebookexternalhit” beginnt ist das recht simpel mit .htaccess möglich. Folgende Eintragung muss man vornehmen, wenn man die Bilder beispiel1.jpg und beispiel2.jpg für Facebook blockieren möchte:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /

RewriteCond %{HTTP_USER_AGENT} ^facebookexternalhit
RewriteCond %{REQUEST_FILENAME} beispiel1.jpg [OR]
RewriteCond %{REQUEST_FILENAME} beispiel2.jpg
RewriteRule .* - [F]

</IfModule>

Sind die blauen Zeilen schon vorhanden, dann müssen nur die übrigen Zeilen zusätzlich dazwischen eingetragen werden. Für mehr Dateien einfach weitere solche Zeilen einfügen und drauf achten, dass bei jeder außer der letzten ein [OR] am Ende steht. Achtung: Wenn überhaupt kein Bild eingetragen ist, dann sperrst du Facebook komplett aus.

Es kann sein, dass dieses Vorgehen nicht sofort Wirkung zeigt. Dann befindet sich das Bild noch im Cache der Facebook-Server. In diesem Fall hilft nur ein wenig Geduld. In diesem Fall hilft vielleicht viel Geduld mit Sicherheit aber, so hab ich es zumindest nach einer Woche vergeblichem warten gemacht, das umbenennen der entsprechenden Dateien, allerdings nur bei Seiten, die in der Vergangenheit noch nicht verlinkt wurden. In diesem Fall muss man die Seite einmal mit dem Facebook-Debugger laden. Dadurch wird der Cache aktualisiert. Allerdings muss jede Seite einzeln aufgerufen werden.

Die Erklärungsseite von Facebook, auf die am Ende der USER-AGENT-Kennung im Log verwiesen wird möchte ich nicht vorenthalte.

Die einfache Identifizierbarkeit Facebooks über die USER-AGENT-Kennung könnte auch eine interessante Möglichkeit sein um Facebook-Verlinkungen ohne die Hilfe von Facebook zu detektieren. Das sollte man bei Gelegenheit mal weiterverfolgen.

Sperren per Open Graph Protokoll

Das Open Graph Protokoll bietet eigentlich keine Möglichkeit Bilder explizit auszuschließen. Durch das festlegen eines Bildes wird jedoch das automatische Suchen nach weiteren Bildern verhindert. Also müssen die gewünschten Bilder angegeben werden, so dass die unerwünschten Bilder nicht auftauchen. Möchte man jedoch kein Bild dem Artikel zuordnen, so ist dies nicht auf regulärem weg möglich. Mit einem kleinen Trick kann man jedoch den Interpreter von Facebook austricksen. Gibt man eine URL an, die zu keinem Bild führt wird der Tag als valider Eintrag behandelt, liefert jedoch kein Bild und es wird nicht automatisch nach Bildern gesucht. Da es nicht reicht einen leeren Eintrag hinzusetzen empfiehlt sich die Verwendung der eigenen Domain:

<meta property="og:image" content="http://example.com" />

WordPress: Fehlerhafte Indizierung vermeiden

Nach der Installation ist WordPress so konfiguriert, dass jede Seite indiziert werden darf, also nicht nur Pages und Posts, sondern auch Post-Listen, wie die Seiten für einzelne Schlagwörter, Kategorien oder Archive und nicht zu vergessen die üblicherweise als Startseite angezeigte Liste aller Posts. Das ist jedoch nicht besonders Sinnvoll, wird dadurch doch der Inhalt eines Posts mehrfach indiziert. Suchanfragen, die sinnvollerweise auf einen bestimmten Post verwiesen hätten, verweisen dann statt dessen auf die Startseite. Doch dort rutscht der Post immer weiter nach unten und verschwindet irgendwann in den hinteren Seiten. Wurde der Suchindex nicht gerade frisch aktualisiert verweist das Suchergebnis möglicherweise auf die falsche Seite.

Sinnvoll wäre es also alle Seiten außer Posts und Pages von der Indizierung, nicht jedoch von der Linkverfolgung auszuschließen. Das kann man zum Beispiel mit dem Plugin Headspace2 machen. Konfiguriert man sein WordPress auf diese Weise, so führen Suchergebnisse zielsicher zur richtigen Seite.

Ein Problem stellt sich jedoch: Wie findet man die Startseite, wenn man nicht einen bestimmten Post, sondern den gesamten Blog sucht? Solange es nicht möglich ist Teile einer Seite von der Indizierung auszuschließen muss man sich entscheiden, ob die Startseite auffindbar ist, dafür aber Fehlindizierungen auftreten oder eben nicht. Ein Mittelweg wäre, den Blog nicht mehr als Startseite erscheinen zu lassen, sondern eine zusätzliche Seite mit einer Willkommenheißung oder was auch immer einzurichten. Deshalb hab ich hier auch seit ein paar Wochen versuchsweise so eine Seite eingerichtet. Zugegeben, auch nicht optimal. Aber besser geht es meines Wissens derzeit leider nicht.

Internet-Don’ts: Links mit dem Text “hier”

Zur Verdeutlichung was ich meine, zu Anfang ein kleines Beispiel.

Der VLC Mediaplayer kann fast alle Dateiformate wiedergeben. Du findest ihn hier.

Der VLC Mediaplayer kann fast alle Dateiformate wiedergeben.

Inhaltlich identisch. Aber es gibt gleich mehrere gute Gründe, weshalb die zweite Variante vorzuziehen ist.

Erst einmal sind sprechende Links für den Leser wesentlich angenehmer. Auf einen Blick wird klar, wozu der Link dient und man muss nicht erst noch die Sätze rundherum lesen.

Aber nicht nur Lesern fällt es dadurch einfacher den Sinn des Links zu erkennen. Suchmaschienen sind wesentlich davon abhängig, dass im Internet sprechende Links verwendet werden, um Webseiten sinnvollen Suchbegriffen zuzuordnen. Wird mit einem bestimmten Wort auf eine Webseite verwiesen, steigt das Ranking dieser Webseite bei diesem Suchbegriff. Und das hilft nicht nur den Suchmaschienen, sondern vor allem den Nutzern, die auf der Suche nach bestimmten Informationen zielsicherer zu einem Ergebnis gelangen. Des weiteren Hilft es dem Betreiber der Webseite. Er bekommt ein höheres Google-Ranking. Da du den Inhalt seiner Webseite offenbar für wertvoll genug hältst, auf ihn zu verlinken, könntest du dem Autor, sozusagen als Dankeschön für seine Hilfe, auch gleich zu einem besseren Ranking verhelfen.

Wie viel das bringen würde, denke ich immer wieder, wenn ich nach irgendeiner Problemlösung suche und dabei in zig Foren auf meine Frage stoße, die letztlich überall mit einem Satz wie “Schau mal hier!” beantwortet wird. Würde nur ein Bruchteil der Antwortenden einen sprechenden Link verwenden, wäre die tatsächliche Lösung mit Sicherheit das erste Suchergebnis.

Schlagwort: Suchmaschine