mod_rewrite Probleme

Alles, was den Apache betrifft, kann hier besprochen werden.

mod_rewrite Probleme

Postby dbCF » 20. June 2005 15:10

Moin,

gestern fiel mir auf, dass irgendwas mit meiner rewrite-rule mächtig unrichtig läuft. Vorweg mal die .htaccess in Auszügen:
Code: Select all
RewriteEngine on

RewriteCond %{SERVER_NAME} (www\.)?dbcf\.de(.*) [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !(.*)dbcf\.de(.*) [NC]
RewriteRule \.(gif|jpg|png)$ /is/htdocs/34229/www.dbcf.de/bilder/pfui.gif [L]

RewriteRule guestbook/guestbook.php gaestebuch_service/gaestebuch.php
RewriteRule guestbook/add.php gaestebuch_service/add.php

RewriteCond %{SERVER_NAME} (www\.)?dbcf\.de(.*) [NC]
RewriteCond %{REQUEST_URI} !(\.php|lo/|db/|gaestebuch_service/)
RewriteRule ^(.*)/$ index.php?topic=$1&subdir=1 [L]

RewriteCond %{SERVER_NAME} localhost
RewriteCond %{REQUEST_URI} !(\.php|lo/|db/|gaestebuch_service/)
RewriteRule ^(.*)/$ index.php?topic=$1&subdir=1 [L]
Das Ziel ist es - und soweit klappt es ja auch -, dass man bei Eingabe von http://dbCF.de/blaettern/ auf der gleichen Seite landet, wie bei http://dbCF.de/index.php?topic=blaettern

Das Problem offenbarte mir Google. Ein Ausschnitt aus dem Accesslog (Accesslog wohlgemerkt, nicht Errorlog!):
Code: Select all
66.249.65.144 - - [14/Jun/2005:13:09:20 +0200] "GET /index.php/bilder/forum/bilder/kontakt/abkuerzungen/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:22 +0200] "GET /index.php/abkuerzungen/programmierung/bilder/dresden/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:22 +0200] "GET /index.php/gasometer-bilder/dresden/forum/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:23 +0200] "GET /index.php/sarrasani/start/abkuerzungen/abkuerzungen/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:28 +0200] "GET /index.php/gasometer-bilder/programmierung/rest/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:29 +0200] "GET /index.php/abkuerzungen/gaestebuch-service/abkuerzungen/dresden/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:30 +0200] "GET /index.php/start/rest/kontakt/rest/forum/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
66.249.65.144 - - [14/Jun/2005:13:09:31 +0200] "GET /index.php/kontakt/gaestebuch-service/besucherzaehler/start/ HTTP/1.1" 200 4771 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "www.dbcf.de"
Die angezeigte Dateigröße (4771 Bytes) lassen auf die Startseite schließen.
Ich weiß allerdings überhaupt und absolut nicht, warum sich bei Google (bei anderen garantiert auch) die Verzeichnisse hinten anhängen. Ich kann es leider absolut nicht nachvollziehen.

Hat irgendwer irgendwelche Ideen?

Ach ja: Apache/1.3.31 (Unix) FrontPage/5.0.2.2635 PHP/4.3.10

Danke
Carsten
dbCF
 
Posts: 3
Joined: 20. June 2005 15:07

Postby dbCF » 22. June 2005 07:49

Ab sofort wird jeder Besuch von Google gephpinfo()t und gespeichert:
--> http://dbCF.de/google/index.php

Wäre grandios, wenn mal wer einen Ansatz einer möglicherweise potentiellen Idee hätte...
dbCF
 
Posts: 3
Joined: 20. June 2005 15:07

Postby dbCF » 23. June 2005 05:31

Gut, die Idee mit phpinfo() hat mir ein riesiges Problem offenbart: Google hat die falschen URLs gespeichert (gibt ja auch keinen 404er) und besucht diese natürlich immer mal wieder. Somit ist für mich nicht ersichtlich, ob es sich um von Google gespeicherte oder Folgefehler durch die Skripte auf meiner Seite handelt.

Nochmal verständlicher. Google hat mich besucht:
2005-06-22 15:01:58
2005-06-22 10:35:57
Dazwischen nicht.
In der phpinfo() von 15 Uhr steht beim REQUEST_URI "/t-abkuerzungen/forum/" Dieser Link kommt also von Google.
Somit kann ich nicht nachvollziehen, welchen Weg Google geht, um diese falschen Links zu bekommen.


Hat wer Ideen?




PS: Da fällt mir ein... vielleicht besteht das Problem ja gar nicht mehr, sondern nur noch im Cache von Google...
Auf alle Fälle ist das alles Mist! So.
dbCF
 
Posts: 3
Joined: 20. June 2005 15:07


Return to Apache

Who is online

Users browsing this forum: No registered users and 3 guests