13.2.2014

Wenige Buchstaben in einer eher obskuren Konfiguration

Ende letzten Jahres hat mein IP-Provider meine Site „umgezogen“ - sprich: auf einen anderen Platz in seinem Server-Park verschoben. Das hat dazu geführt, daß ich die Verwaltungssoftware meiner Seiten nicht mehr erreichen konnte (was, für mich, kein Drama ist). Irgendwann habe ich beim Support nachgefragt, und bekam einen neuen Zugriff - Problem gelöst (dachte ich).

Vor etwa zwei Wochen bin ich dann darüber gestolpert, daß die Anzahl der Zugriffe auf meine Website via Google immer weiter zurück geht. Bis zu diesem Zeitpunkt hatte ich ca. 50 Google-Anfragen täglich (ich habe ja eine ganz kleine Website, ein Hobby) – plötzlich keine mehr. Googles Webmaster-Tool half, das Rätsel zumindest teilweise zu lösen: jeder Request auf meine Seiten vom Google-Bot löste einen 404-Error („Page not found“) aus. Ich habe erst nicht kapiert, warum – der Zugriff auf die angeblich nicht vorhandenen Seiten funktionierte, im Browser, nach wie vor fehlerfrei.

Nachdem ich bei dem Versuch, das Problem zu verstehen, im Setup des Webservers (Apache; in der .htaccess-Datei) ein wenig herumgespielt hatte, kamen dann alle Zugriffe auf Links auf meine Seite mit einem 404-Error zurück – nicht nur von Google, sondern auch vom Browser. An dieser Stelle war ich durchaus erleichtert: es war klar, daß nicht etwa Google etwas gegen meine Präsenz im 'net hat, sondern daß da irgendwo ein technischer Fehler vorliegt.

Ich habe länger herumgesucht (meine php-Scripts mit "echo"-Ausgaben geradezu verseucht, um so etwas wie Debugging zumindest zu simulieren; nach Hinweisen gegoogelt), um endlich zum Schluß zu kommen, daß es nicht an meinen Skripten liegt, sondern an der Konfiguration des Servers.

To cut a long story short: der „Umzug“ war auch mit einem Update der Server-Software verbunden. Apache, in der neueren Version, „versteht“ es nicht mehr, daß der Access auf meine Seiten über eine Datei ohne Extension verläuft. Der Hauptanker war bislang eine Datei namens „htdocs“. Das funktioniert nicht mehr; ich mußte das ersetzen durch „index.php“ („htdocs.xx“ wäre wahrscheinlich auch gut genug; ich habe das erst gar nicht versucht; keine Lust auf Experimente).

Um den Zugriff auf meine Site auch mit „alten“ URLs zu ermöglichen, habe ich im .htaccess von Apache ein „redirect“ eingeführt (ich gehöre nicht dem ehrwürdigen Berufsstand der Web-Admins an, und habe somit nicht die leiseste Ahnung, was ich hier mache – es scheint aber zu funktionieren):

RewriteEngine on Redirect /index.php/ /index.php/

Jetzt sollte das alles wieder so funktionieren wie zuvor. Der Google-Bot braucht allerdings sicherlich noch einige Zeit, bis er Google dazu verleitet, die Suchbegriffe, die in den letzten Jahren zuverlässig auf meine Site verwiesen, wieder oben in den Suchergebnissen aufzulisten.

Warum erzähle ich das so ausführlich? Die Schlußfolgerung finde ich ebenso spannend wie beängstigend: wenige Buchstaben in einer eher obskuren Datei entscheiden darüber, was man in dieser Welt gilt.

(Kommentarfunktion z.Zt. deaktiviert.)
Array 54.221.147.93&&16:20 - 10.12.&&2&&(unknown)&&&&CCBot/2.0 (https://commoncrawl.org/faq/)&& 46.229.168.146&&16:20 - 10.12.&&1&&(unknown)&&&&Mozilla/5.0 (compatible; SemrushBot/2~bl; +http://www.semrush.com/bot.html)&&