Skocz do zawartości

a jednak łazi


pneuma

Rekomendowane odpowiedzi

było kilka dyskusji na ten temat - czy googlebot łazi przedstawiajac się jako zwykły user i oto proszę:

google3py.gif

IP: https://whois.sc/66.249.65.207

a normalnie bot przedstawia się tak:

google4qg.gif

i to coś miało u mnie dziś więcej odsłon niż normalny bot

google1pz.gif

jak dla mnie wniosek z tego jeden - nie można opierać swych działań na user-agent

Canon sony aparaty cyfrowe, kamery cyfrowe - promocja. Atrakcyjny system ratalny. Katalog stron www

Odnośnik do komentarza
Udostępnij na innych stronach

zdobyć wszystkie możliwe IP google

widziałem gdzieś pule IP jakie są przydzielone oficjalnie dla bota google, poszukam to wrzucę na razie jakoś nie mogę znaleźć :)

Canon sony aparaty cyfrowe, kamery cyfrowe - promocja. Atrakcyjny system ratalny. Katalog stron www

Odnośnik do komentarza
Udostępnij na innych stronach

... ale... tak przecież 'od lat' chyba jest. Przecież z pół roku temu

pisaliśmy z Jeżem o tym, a zastanawialiśmy się jedynie, czy jest taki

bot, który chodzi bez ua po Sieci.

I można na ua polegać w takim samym stopniu jak dotychczas, o ile

sprawdza się obecność w nim słowa 'Googlebot'.

Dalej: można domniemywać, co robi taki 'guglowy explorer'. Sprawdza

nowe połączenia, modyfikację stron, a dopiero właściwy bot pobiera

zawartość do bazy?

Szy.

Odnośnik do komentarza
Udostępnij na innych stronach

a zastanawialiśmy się jedynie

noć własnie jak dla mnie to jest jakimś dowodme na te wszytskie dyskusje w których były opinie ze coś takiego jest - tak jak z Yeti :)

co do ua to tego tez nie jestem pewien czy to wystarczy, przeszukam logi wg ip zobaczę moze coś ciekawego

no ale co w takim razie z fresh botem? bo z tego wniosek zę to jednak nie to samo?

Canon sony aparaty cyfrowe, kamery cyfrowe - promocja. Atrakcyjny system ratalny. Katalog stron www

Odnośnik do komentarza
Udostępnij na innych stronach

no to ładnie - się nie popisałem :)

ja jak dotychcsz obserwowalem tylko userów którzy zmienli sobie ua ale ip ich nie pokrywał się z ip google - to dla mnie jest ta róznica.

bo dotychczas widziałem tylko takie jak

Googlebot/1.0 (googlebot@googlebot.com https://googlebot.com/)

Googlebot/2.1 (+https://www.googlebot.com/bot.html)

Googlebot/2.0 beta (googlebot(at)googlebot.com)

Googlebot/2.1 (+https://googlebot.com/bot.html)

Googlebot/2.0 (+https://googlebot.com/bot.html)

Googlebot/1.0 (googlebot(at)googlebot.com)

Googlebot/2.1w (+https://googlebot.com/bot.html)

Googlebot-w/2.1 (+https://googlebot.com/bot.html)

ponoć ktoś widział dsl.google.com Mozilla/4.51 [en] (X11; I; Linux 2.2.5-15 i686) 207.88.29.130 za https://tinyurl.com/a369o

Canon sony aparaty cyfrowe, kamery cyfrowe - promocja. Atrakcyjny system ratalny. Katalog stron www

Odnośnik do komentarza
Udostępnij na innych stronach

ponoć ktoś widział dsl.google.com

tak samo widziano wap.google.com :)

bo dotychczas widziałem tylko takie jak

Nie mam w tej chwili reka logow z mozilla i googlebotem ale jestem tak bardzo pewien, ze takie mam jak ze Koscisuko nie zyje. :)

Postaram sie znalezc to w jakichs logach.

(X11; I; Linux 2.2.5-15 i686

To mi sie bardzo podoba jednak, bo widze ze google korzysta z linux jako systemu operacyjnego na ktorym pracuja pracownicy. Tylko nie wiem dlaczego musze zawsze odpalac laptopa z windowsem, zeby uruchomic np. earth.google.com.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności