Skocz do zawartości

Wyciąganie Anchorów


gripek

Rekomendowane odpowiedzi

jak rozumiem osoby polecające Majestica i SpyGlassa wyobrażają sobie tworzenie 1000 raportów, później złączanie tego w jeden plik i filtrowanie?

Scrapeboxem też tego nie wyciągniesz, nie ma wtyczki, ani defaultowej opcji, która wyciąga pary anchor+link, można wyciągnąć co najwyżej wszystkie linki do danej strony. Z SB dodatkowo problem jest taki, że on nie harvestuje serwisu tylko Google, więc jeśli coś nie jest zaindeksowane to być tego nie wyciągnął.

Możesz pomyśleć o Xenu, albo Screaming Frogu, ale przy dużej liczbie domen to też raczej ciężka robota.

Swego czasu tego potrzebowałem i mam mini programy napisane do tego typu rzeczy (w sumie to 1 dobre wyrażenie regularne z odpowiednim GUI). Niestety soft przeszedł sporo modyfikacji od tamtej pory :)

zdecydowanie najlepsze gry przeglądarkowe online

kurs java programowanie obiektowe

Rynek walutowy i podstawy forex w jednym miejscu

Odnośnik do komentarza
Udostępnij na innych stronach

Faktycznie od xxxx strony na to spojrzałem, ale wyciągając raport ze spy glassa, czy majestica nadal nie mamy listy stron, które chcemy sprawdzić. Biorąc pod uwagę, że część linków - pewnie z 30% nie znajdzie się w raporcie (zablokowanie robota itp) to jest jeszcze gorzej.

zdecydowanie najlepsze gry przeglądarkowe online

kurs java programowanie obiektowe

Rynek walutowy i podstawy forex w jednym miejscu

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności