Skocz do zawartości

Cos ala rel=nofollow dla formularza html?


Krzysztof_

Rekomendowane odpowiedzi

Witam

Google indeksuje mi, cholernie wysoko ale jednak zle. Sam wysyla formularz (metoda GET) z losowymi kombinacjami pol. Tzn pokazuje np stare newsy z archiwum (wyszukanie nastepuje TYLKO po slowach w descrition i TITLE wiec tresc strony nie ma znaczenia) i to tylko z zalacznikiem. Takich np nie posiadam.

Chce zablokowac dostep do formularza przez ktory to on sobie wysyla.

<form rel="nofollow"> jest poprawne?

p.s

Tego sie nie da zablokowac przez robots.txt!

Odnośnik do komentarza
Udostępnij na innych stronach

po prostu zmień na post, albo przekieruj na stronę w której meta masz noindex+nofollow i z niej zrób redirect z dodatkowym parametrem.

No moze... ale GET lepszy w tym wypadku, najlepsze ze linkow jakie indeksuje nie mam na stronie jako wiesz link statyczny <a href=....>, on sobie sam to wysyla :| :-(

Odnośnik do komentarza
Udostępnij na innych stronach

<?
if(isset($_GET['parametr']) || isset($_GET['inna zmienna']) || isset($_GET['jeszcze cos']))
{
echo '<meta name="Robots" content="nofollow, noindex " />';
}
else
{
echo '<meta name="Robots" content="all " />';
}
?>

Zmienne get uzupełnij i wystarczy :P

E: W head wstaw ;)

Jeszcze możesz w robots.txt pokombinować i takie tam.

nihil fit sine causa

Odnośnik do komentarza
Udostępnij na innych stronach

Nie wydaje mi się, żeby google "wysyłał" formularz. Może to użytkownicy zamieścili te linki (Skoro nie masz na stronie). Jeśli tak, to i post i doklejanie zmiennych do get to zły pomysł bo przestanie im działać.

Dlaczego robots nie działa? Sprawdź w narzędziach dla webmasterów, czy google je widzi, najlepiej coś w stylu (robots.txt):

User-Agent: Googlebot

Disallow: /katalog/wyszukiwarka.php

Odnośnik do komentarza
Udostępnij na innych stronach

Nie wydaje mi się, żeby google "wysyłał" formularz. Może to użytkownicy zamieścili te linki (Skoro nie masz na stronie). Jeśli tak, to i post i doklejanie zmiennych do get to zły pomysł bo przestanie im działać.

Google od jakiegoś czasu przemierza formularze GET wywołując je w jakiś sposób dobranymi słowami kluczowymi. Jest to oficjalna informacja od google (tj. pisali kiedyś, że coś takiego wprowadzili).

Sprawdź liderów systemów wymiany linków:

linkme.pl (stały), gotlink.pl (rotacyjny)

alexain.jpgalexaol.jpgalexaat.jpg

Odnośnik do komentarza
Udostępnij na innych stronach

Google od jakiegoś czasu przemierza formularze GET wywołując je w jakiś sposób dobranymi słowami kluczowymi. Jest to oficjalna informacja od google (tj. pisali kiedyś, że coś takiego wprowadzili).
Bzdura. Wyobrażasz sobie co by było gdyby robot przypadkiem zalogowal się do jakiegoś panelu admina i jakich by tam spustoszeń dokonał? Albo jakby zalogowal się na kogoś konto bankowe , zaindeksował by te strony i pokazywał w swoim cache?

.

Odnośnik do komentarza
Udostępnij na innych stronach

Kiedyś też czytałem o tym, że bot Googla będzie to robił. Z tego co pamiętam, dotyczy to tylko formularzy wysyłanych metodą GET (zazwyczaj wyszukiwarki; pozostałe formularze powinny używać POST). Do tych formularzy będzie wpisywał frazy znalezione na stronie. O tym że tak możecie przeczytać tutaj i tutaj.

Polecam moje pluginy do WordPress'a: WyPiekacz, Meta SEO Pack, User Locker, Google Integration Toolkit i wiele innych :)

Poradnik Webmastera ‰ Ostatnio na blogu:

PoradnikWebmastera-Blog.1.gif

Odnośnik do komentarza
Udostępnij na innych stronach

Spoko to wstawiajmy wyszukiwarki na spamiarki, będzie dodatkowy sajt :P

Wyszukiwarki nie będą starały się logować ani dodawać nowych użytkowników - roboty nie będą wykorzystały formularzy używających metody GET, która powinna być wykorzystywane do przesyłania prywatnych/poufnych danych. Google nie będzie korzystał także z formularzy, które zawierają hasła.

Ciekaw jestem w jaki sposób bot ma rozróżnić formularz logowania od innych :)

Jakoś nie przekonują mnie te "źródła" ...

"bytka abo ne bytka to je zapytka" - W. Shakespeare ;)

Niekończąca się impreza ;) ... wątroba zaleczona :D

Odnośnik do komentarza
Udostępnij na innych stronach

Ciekaw jestem w jaki sposób bot ma rozróżnić formularz logowania od innych

Po polu password? :P Poza tym jakiekolwiek dane używane do modyfikacji stanu aplikcaji (np. danych w panelu admina, czy logowania) powinny by wysyłane właśnie POST. Są panele, gdzie się to robi GETem albo z pomocą zwykłych linków, ale to błąd programisty i praktycznie wszystko może dokonać w takim panelu spustoszeń (akceleratory, roboty, publicznie dostępne statystyki cache, etc).

Odnośnik do komentarza
Udostępnij na innych stronach

ale to błąd programisty i praktycznie wszystko może dokonać w takim panelu spustoszeń (akceleratory, roboty, publicznie dostępne statystyki cache, etc).

To nie jest żaden błąd, jeśli skrypt jest odpowiednio zabezpieczony.

"bytka abo ne bytka to je zapytka" - W. Shakespeare ;)

Niekończąca się impreza ;) ... wątroba zaleczona :D

Odnośnik do komentarza
Udostępnij na innych stronach

Wchodzisz do panelu admina (odpowiednio zabezpieczonego), jesteś zalogowany i masz tam link

<a href='?do.php&a=usun_konto'>usuń konto</a>

teraz akcelerator (takie coś co pobiera treść linków, aby przyspieszyć przeglądanie) leci sobie po linkach, pobiera jeden, drugi, dziesiąty a na końcu zawartość linku "usuń konto".

Teraz przechodzi poziom niżej, pobiera usuń konto->anuluj (redirect do poprzedniej strony) i usuń konto->potwierdź. Konto jest usunięte.

Nawet jeśli zabezpieczyłeś URL plikiem robots to i tak niczego nie zmienia (plik może zostać uszkodzony w trakcie transmisji, to mało prawdopodobne ale jednak i mogę podać przynajmniej z 10 sytuacji kiedy może się to zdarzyć).

Użycie GET do logowania to luka w bezpieczeństwie. Dobrze napisany skrypt przestrzega tej reguły, to są podstawy podstaw. Dobrze napisany automat nigdy nie pójdzie po POST. Widziałeś jakikolwiek webmail czy bank gdzie masz wykonywanie jakiejkolwiek czynności po _GET?

Odnośnik do komentarza
Udostępnij na innych stronach

akcelerator (takie coś co pobiera treść linków, aby przyspieszyć przeglądanie) leci sobie po linkach, pobiera jeden, drugi, dziesiąty a na końcu zawartość linku "usuń konto".

1. Kto wpuszcza roboty czy akceleratory do panelu admina? :jezyk1:

2. Kluczowe operacje w panelu admina powinny wymagać jakiegoś potwierdzenia.

Użycie GET do logowania to luka w bezpieczeństwie.

Też tak myślę :) ale nie znaczy to, że po zalogowaniu mam go nie używać.

Posta używa się troszkę w innym celu - żeby nie przekazywać danych tajnych (jak np. hasło) w sposób jawny w urlu.

"bytka abo ne bytka to je zapytka" - W. Shakespeare ;)

Niekończąca się impreza ;) ... wątroba zaleczona :D

Odnośnik do komentarza
Udostępnij na innych stronach

1. Kto wpuszcza roboty czy akceleratory do panelu admina?

Akceleratory działają jako moduły przeglądarek - są "wpuszczane" tam, gdzie akurat wejdzie użytkownik, jak chcesz wejści do panelu z pomocą przeglądarki i jednocześnie tam nie wchodzić? :jezyk1:

2. Kluczowe operacje w panelu admina powinny wymagać jakiegoś potwierdzenia.

Jeśli potwierdzenie robisz za pomocą linku lub GET to jak na poprzednim przykładzie - robot może sam akcję "potwierdzić"... chodząc po linkach. Tu jest proste rozróżnienie - jeśli jakaś akcja wykonywana jest po GET to z definicji ma nie zmieniać stanu aplikacji i robot na pewno ją wykona, bo dla niego to "zwykłe" hiperłącze.

Posta używa się troszkę w innym celu - żeby nie przekazywać danych tajnych (jak np. hasło) w sposób jawny w urlu.

Też ale nie tylko. Na przykład też w celu ominięcia cache i nie wpuszczania robotów. Jeśli wykonujesz akcję 2 razy a korzystasz z proxy/cache i używasz get to prawdopodobnie drugie zapytanie nigdy nie trafi do serwera - zostanie po prostu odczytane z pamięci podręcznej.

Prosty przykład: bank, robisz 2 takie same przelewy. Siedzisz za proxy / cache. Dochodzi jeden - serwer proxy potraktuje zapytanie GET jako zapytanie które nie zmienia stanu aplikacji, więc pobierze wynik i umieści go w cache. Następny taki sam przelew będzie można zrealizować dopiero kiedy dane w cache się zdeaktualizują, a to zależy od konfiguracji. Na sieciach osiedlowych może to być nawet kilka dni albo tydzień.

Dlaczego po wysłaniu POST i naciśnięciu F5 przeglądarka nie może wyświetlić strony? Bo te dane są ZAWSZE wyłączone z cache i z definicji mają powodować akcję z strony systemu.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności