Skocz do zawartości

googlebot olewa robots.txt?


vel

Rekomendowane odpowiedzi

Ciekawa obserwacja

Na jednym z serwisów www od samego początku sobie siedzi w roocie plik robots.txt. Jedna z regułek brzmi mniej więcej tak:

User-agent: *

Disallow: /data/

Według tego https://www.google.com/support/webmasters/b...py?answer=40362 taki wpis powinien zabronić indeksacji katalogu data oraz wszystkich podkatalogów

To block a directory and everything in it, follow the directory name with a forward slash.

Disallow: /private_directory/

No a sprawdzam sobie site mojej strony a tu pięknie poindeksowane pliki cache będące w jednym z podfolderów folderu /data/. Czy ja tu coś popieprzyłem czy googlebot się pcha gdzie nie powienien? Chyba będę musiał zablokować dostęp htaccessem do tego katalogu spoza samego localhosta :/

WTF? Ktoś ma jakiś pomysł ?

Kup sobie nieruchomości Kraków albo apartamenty Zakopane. Obejrzyj też fotoblog Grzegorza Ziemiańskiego Nowa Huta na deser

Odnośnik do komentarza
Udostępnij na innych stronach

akurat nie o ten sajt chodziło, ale dzięki za zwrócenie uwagi przy okazji :P już zablokowałem listing katalogów

a tam gdzie mam opisany problem listing jest wyłączony i to nie pomaga. zrobiłem blokadę przy pomocy htaccessa ale dalej ciekawi mnie jak bot to pobrał

Kup sobie nieruchomości Kraków albo apartamenty Zakopane. Obejrzyj też fotoblog Grzegorza Ziemiańskiego Nowa Huta na deser

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności