Skocz do zawartości

Wyszukiwanie kodu stron w google


albwikesl

Rekomendowane odpowiedzi

Witam. Czy jest może jakaś wyszukiwarka lub program, który pozwolił by na wyszukiwanie stron zawierających dany kod? Powiedzmy, że chciałbym uzyskać listę stron zawierających kod:

<script type="text/javascript" src="/media/system/js/caption.js"></script>

Czy instnieje taki program, lub wyszukiwarka, która by na to pozwoliła? Mowa tutaj oczywiście o wyszukiwaniu tych stron w google.

Odnośnik do komentarza
Udostępnij na innych stronach

Nie znam, ale jak dobrze poszukasz to znajdziesz zcukrowaną :)

Widziałem takie na kilku zagranicznych forach.

Tak jak koledzy wpomnieli wyżej po tagu nie znajdziesz, musisz znaleć jakis charakterystyczny najlepiej niepowtarzalny "odcisk".

Z tego co wiem to takiej scieżki używa joomla. Więc przykładowy footprint mogłby wygladać "Powered by Joomla";

Odnośnik do komentarza
Udostępnij na innych stronach

Hmm... Powiedzmy, że jest strona, która używa SWL (nie mówie, że o to chodzi, ale na tym przykładzie jest łatwiej zobrazować). I powiedzmy że każda strona w danym SWL'u ma charakterystyczny fragment kodu, który powiedzmy jest taki:

<td><strong><a>SWL</a></strong></td>

I moim zadaniem jest wyszukanie wszystkich stron z takim fragmentem kodu na www. Jeśli moje pytanie jest zgodne z Pańską odpowiedzią zawartą wyżej to przepraszam, ale myślę, że chyba się nie rozumiemy. :)

Odnośnik do komentarza
Udostępnij na innych stronach

Scrapebox używa google (i innych) i wyszukuje dokładnie tak, jakbyś wyszukiwał ręcznie - z tym, że wyniki zapisuje w przystępnej formie. Nie możesz dzięki niemu wyszukać po fragmentach kodu, a wyłącznie po tym, co widzą wyszukiwarki. Np. "Powered by wordpress" itp. znajdzie Ci wordpressy. Nie jest rozwiązaniem problemu z pierwszego posta.

PlatformReader o którym pisałem robi to, czego potrzebujesz, ale jemu musisz dostarczyć listę linków do zbadania. Możesz pokombinować więc z tymi 2 narzędziami.

Odnośnik do komentarza
Udostępnij na innych stronach

  W dniu 3.12.2012 o 19:10, bojownik napisał(a):

Więc przykładowy footprint mogłby wygladać "Powered by Joomla";

błagam.... mówiłeś coś, czy mi się wydaje, że masz pojęcie o odciskach stopy...?

a do autora tematu:

żeby jakiekolwiek narzędzie było w stanie przeanalizować kod, to musi go najpierw sobie przeczytać... czyli, żeby działało według potrzeb, musiałoby by postępować według poniższego schematu:

  1. pobrać z danej szukajki właściwie wszystko, co ma zaindeksowane, (upsss)
  2. otwarcie wszystkich stron, jako bot,
  3. następnie (dopiero) nadanie footprinta i przeszukanie w stworzonej bazie...
  4. powodzenia

jak chcesz analizować fragment kodu, to musisz pominąć dwa pierwsze kroki, wczytać listę "podejrzanych" urli i skorzystać np. z narzędzia podanego przez @gibkiego

  Cytat
jak dobrze poszukasz to znajdziesz zcukrowaną

uważaj, za takie teksty już dawałem bany na PiO... na tym forum nie popieramy piractwa

  Cytat
najpierw niestety trzeba wiedzieć co to footprint i jak działa Google, żeby dawać rady innym

:good:

dymna.jpg

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności