Skocz do zawartości

Rozpoznanie robotów sieciowych


M@k

Rekomendowane odpowiedzi

Witam

 

Wiele stron widzę wyświetla co innego dla użytkowników, a co innego dla robotów sieciowych. Np. klienci kupili to i to,

podobne przedmioty, rożne informacje itd.

 

I tak się zastanawiam jak to można zrobić bo tak, z tego co testowałem to robot google czyta chyba już prawie wszystko.

Cookie, javascript itd

 

I nie wiem jak oni serfują dodatkowe informacje których roboty nie widzą. Raczej bał bym się wyświetlać dla konkretnego user agenta, bo to lekko pod cloaking podpada.

 

Macie jakieś pomysły jak to może być rozwiązane.

 

Dzięki.

 

Odnośnik do komentarza
Udostępnij na innych stronach


Macie jakieś pomysły jak to może być rozwiązane.
TAK:

- IP

- UserAgent

- Cookies dl kolejnych żądań HTTP

 

...

 

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Dzięki za odpowiedz.

 

Tylko tak:

 

IP - co to znaczy musiałbym mieć wszystkie IP np Google, czy binga?

UserAgent - czy Google tego nie zabrania ukrywania przed nim specjalnie

​Cookies - ale jak zrobić przy pierwszym wejściu

 

 

 

Odnośnik do komentarza
Udostępnij na innych stronach


UserAgent - czy [...]
Poczytaj o mechanizmach żądania HTTP, które stanową podstawę działania "robota sieciowego". Bo jak widać z w/w, nie masz o tym zielonego pojąca.

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

IP - co to znaczy musiałbym mieć wszystkie IP np Google, czy binga?

Jeśli chcesz rozpoznać klienta wykonujacego żadanie HTTP po IP musisz mieć listę jego IP;

 

 

UserAgent - czy Google tego nie zabrania ukrywania przed nim specjalnie

To klient powinien się przedstawiać konkretnym UserAgentem, wiec nie masz na to wpływu / nie dotyczy.

 

Cookies - ale jak zrobić przy pierwszym wejściu

Też nie masz na to wpływu gdyż w uproszczeniu cookie zapisywane jest po stronie klienta, a nie serwera / nie dotyczy.

 

Jak widzisz wiesz, że nic na ten temat nie wiesz :)

 

===

Klient w tym wypadku = Robot sieciowy np GoogleBot

Serwer = Twoja stron www jakiej, to ma tyczyć;

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Raczej to co napisałeś to każdy wie, nowości to tu nie ma..

 

A to kompletnie nie jest odpowiedz na moje pytanie.

 

Moje pytanie brzmiało, jak w bezpieczny sposób wyświetlić  dodatkowe np. boksy tylko dla normalnych użytkowników, a nie dla robotów sieciowych.

 

 

IP i UserAgent  Google może zmienić w każdej chwili i Google może stwierdzić ze tu coś nie halo.

Coookie nadaje się tylko dla użytkownika który jest np. zalogowany lub wejdzie na kolejna podstronę.

Przy pierwszym wejściu odpada. 

Odnośnik do komentarza
Udostępnij na innych stronach


Raczej to co napisałeś to każdy wie, nowości to tu nie ma..
No popatrz.. jednak po tym co napisałeś Ty się do niech nie zaliczasz.

 


A to kompletnie nie jest odpowiedz na moje pytanie. Moje pytanie brzmiało, jak w bezpieczny sposób wyświetlić dodatkowe np. boksy tylko dla normalnych użytkowników, a nie dla robotów sieciowych.
Też udzieliłem Ci na to pełnej odpowiedzi.

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach


Też udzieliłem Ci na to pełnej odpowiedzi.

 

W którym miejscu?

 

IP i UserAgent  Google może zmienić w każdej chwili i Google może stwierdzić ze tu coś nie halo.

Coookie nadaje się tylko dla użytkownika który jest np. zalogowany lub wejdzie na kolejna podstronę.

Przy pierwszym wejściu odpada. 

Odnośnik do komentarza
Udostępnij na innych stronach


Moje pytanie brzmiało, jak w bezpieczny sposób wyświetlić  dodatkowe np. boksy tylko dla normalnych użytkowników, a nie dla robotów sieciowych.

 

ajax po załadowaniu strony wystarczy

 


z tego co testowałem to robot google czyta chyba już prawie wszystko.

 

ale nie musisz go wpuści do zasobów pobieranych ajaxem, blokujesz np przez referrer,sesję,token etc.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności