Skocz do zawartości

Blokowanie złych robotów - dobry kod?


SobiePan

Rekomendowane odpowiedzi

Witam,

uprzejmie proszę specjalistów w tym zakresie o odpowiedź, czy poniższe pliku są poprawne i skutecznie zablokują mi dostęp do stron. Mam ich kilkadziesiąt i wolę zapytać najpierw, niż zmieniać to później ;)

Dzięki za pomoc!

robots.txt

User-agent: Googlebot
Disallow:
User-agent: msnbot
Disallow:
User-agent: Slurp
Disallow:
User-agent: Teoma
Disallow:
User-agent: rogerbot
Disallow: /
User-agent: exabot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: dotbot
Disallow: /
User-agent: gigabot
Disallow: /
User-agent: AhrefsBot
Disallow: /
User-agent: *
Disallow: /

htaccess

SetEnvIfNoCase User-Agent .*rogerbot.* bad_bot
SetEnvIfNoCase User-Agent .*exabot.* bad_bot
SetEnvIfNoCase User-Agent .*mj12bot.* bad_bot
SetEnvIfNoCase User-Agent .*dotbot.* bad_bot
SetEnvIfNoCase User-Agent .*gigabot.* bad_bot
SetEnvIfNoCase User-Agent .*ahrefsbot.* bad_bot
SetEnvIfNoCase User-Agent .*sitebot.* bad_bot
<Limit GET POST HEAD>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>

Odnośnik do komentarza
Udostępnij na innych stronach

Pewnie nie chce żeby mu jakiś googlebot wałęsał się po serwerze :peace:

"Ja nie bywam w kuluarach, nie wiem gdzie to jest. Bywam w innych miejscach w innym towarzystwie..." SEO Norris - cytat roku 2014
"Dlatego dużo firm i freelancerów zajęło się pp, nie poradzili sobie z klientami i aktualizacjami algo." Cytat wszech czasów!

Odnośnik do komentarza
Udostępnij na innych stronach

Strzelam, że:

User-Agent: *

Disallow: /

User-Agent: Googlebot

Allow: /

User-Agent: Googlebot-Mobile

Allow: /

User-Agent: Googlebot-Image

Allow: /

User-Agent: Mediapartners-Google

Allow: /

User-Agent: bingbot

Allow: /

Oczywiście spamboty nie czytają robots.txt - mają go w głębokim poważaniu. ;)

Odnośnik do komentarza
Udostępnij na innych stronach

Kolejność warunków w robots.txt nie jest ważna:

https://developers.g...docs/robots_txt

"Order of precedence for user-agents"

Wracając do tematu, to wiele botów się nie przedstawia i nie czyta robots.txt, ale możesz je wycinać po IP w htaccess

PS. nie ma złych robotów - są tylko mniej lub bardziej natrętne :P

BlackPress.pl - Automatyczna dodawarka do precli [Najtańsza na rynku - wystawiamy FV]

BlackPress.pl na forum PiO

Darmowa mieszarka synonimów

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności