Skocz do zawartości

GScraper - najszybszy harvester i dodawarka.


Paweł Sokołowski - Eline

Rekomendowane odpowiedzi

Załóżmy, że chcę:

- wyszukać subdomeny na domenie wordpress.com

- mają mieć w tytule słowo "art"

- w treści strony mają się znaleźć słowa "artystycznie" i "kultura"

site:wordpress.com intitle:art

keywordy: artystycznie kultura

znajdź sobie dobre proxy :)

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 515
  • Dodano
  • Ostatniej odpowiedzi

Załóżmy, że chcę:

- wyszukać subdomeny na domenie wordpress.com

- mają mieć w tytule słowo "art"

- w treści strony mają się znaleźć słowa "artystycznie" i "kultura"

site:wordpress.com intitle:art

keywordy: artystycznie kultura

znajdź sobie dobre proxy :)

Faktycznie z tym proxy może być problem;) dzięki

Masz artystyczną stronę? Dodaj ją do artystycznego katalogu sztuki ARTKATALOG.PL
Jeśli nie masz artystycznej strony, nic straconego! Dodaj ją do europejskiego katalogu stron ZWARTA.EU

Odnośnik do komentarza
Udostępnij na innych stronach

program przy postowaniu zapisuje falszywe raporty, na liscie dofollow auto approve wcale nie ma moich komentarzy i blogi wcale nie sa dofollow (wp) Z doswiadczenia ze scrapeboxem i xrumerem wiem ze wordpressow autoapprove i doffolow jest jak na lekarstwo, okolo 1-2 blogi na 1000 sa AA, a tu zapuscilem liste 55k blogow wp i mam 4k blogow AA, WTF?

Odnośnik do komentarza
Udostępnij na innych stronach

Lamenty i płacze, że nie ma dofollow lub zbyt mało jest miejscówek z aa...:D

GS jest szybki i to jest jego zaleta! Dodaje mniej więcej do połowy mniej miejscówek niż SB, ale jest kilka razy szybszy.

Tego softu nie używa się by dodawać komentarze do trudnych miejsc :D

Raporty z gs? są inne narzędzia :)

Odnośnik do komentarza
Udostępnij na innych stronach

  • 2 tygodnie później...
  • 2 tygodnie później...
  • 2 tygodnie później...

Są może jakieś plany wdrożenia łamania captchy gdy ją google wyświetli? Bo teraz dość mało wydajne stają się proxy - gdy przy pierwszym pojawieniu się captchy - proxy jest odrzucane.

https://www.punktseo.pl/darmowe-bonusy/ << rozdaje: kody do katalogów firm, kody rabatowe, szablony ZennoPoster ! |---| Moje strony: https://www.s90.pl/pozycjonowanie/ | https://www.seo-stat.pl - zapraszam.                                                                                                                                                                                          

seo-stat-logo.png

 

Odnośnik do komentarza
Udostępnij na innych stronach

  • 3 miesiące temu...

Taka sytuacja: ustawiam sobie pobieranie proxy z API, dajmy na to z proxy-market, co np. parę minut. Puszczam scrapowanie z jakąś rozsądną ilością wątków bez przesady i zostawiam harvest. Przez parę godzin obserwuję drastyczny spadek prędkości, z np początkowych 50 tyś urli na minutę do jakichś 3 tyś... Wniosek nasuwa się taki, że automatyczne pobieranie proxy co zadane parę minut w ogóle nie działa przy scrapowaniu? (gdy Gscraper nic nie robi importuje proxy podmieniając obecne co zadany czas pięknie wyświetlając nawet komunikat o tym - w czasie scrapowania komunikatu o tym brak)

LaoHost - tani i niezawodny / dhosting.pl - dla stron o dużym ruchu, skalowalne zasoby z płatnością godzinową (link daje 5% rabatu) / spideric - genialny monitoring pozycji niezależny od sytuacji z proxy

Odnośnik do komentarza
Udostępnij na innych stronach

Tak ten z cache stosuję naturalnie ale że spadek prędkości harvestowania może być tak kolosalny to jestem zdziwiony. Tym bardziej że te footprinty nie zawierają jakichś dziwnych znaków itp przy których gscraper zwykle od razu daje monit że harvest może być spowolniony. W Twoim przypadku cykliczny import proxy daje radę, prędkość w czasie jest średnio mniej więcej zadowalająca, nie spada niemal do zera?

LaoHost - tani i niezawodny / dhosting.pl - dla stron o dużym ruchu, skalowalne zasoby z płatnością godzinową (link daje 5% rabatu) / spideric - genialny monitoring pozycji niezależny od sytuacji z proxy

Odnośnik do komentarza
Udostępnij na innych stronach

Czyli tak czy inaczej podmianka proxy w tle w czasie harvestu musi działać i pewnie problem leży w samych proxy, dzięki za info!

LaoHost - tani i niezawodny / dhosting.pl - dla stron o dużym ruchu, skalowalne zasoby z płatnością godzinową (link daje 5% rabatu) / spideric - genialny monitoring pozycji niezależny od sytuacji z proxy

Odnośnik do komentarza
Udostępnij na innych stronach


teraz uzywam prywatne proxy z mojej stopki, 10 sztuk i jedzie ostro przy wpcomment 40k na minute i nie spada
40.000 / 60 sekund = ~ 666,6 sek1 watek

/ na 10 wątków ~ 66 sek

/ 100 wątków ~ 6 sekunde na watek

przyjmując zerowy czas zestawienia połączenie HTTP

:hmmm:

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Taka sytuacja: ustawiam sobie pobieranie proxy z API, dajmy na to z proxy-market, co np. parę minut. Puszczam scrapowanie z jakąś rozsądną ilością wątków bez przesady i zostawiam harvest. Przez parę godzin obserwuję drastyczny spadek prędkości, z np początkowych 50 tyś urli na minutę do jakichś 3 tyś... Wniosek nasuwa się taki, że automatyczne pobieranie proxy co zadane parę minut w ogóle nie działa przy scrapowaniu? (gdy Gscraper nic nie robi importuje proxy podmieniając obecne co zadany czas pięknie wyświetlając nawet komunikat o tym - w czasie scrapowania komunikatu o tym brak)

To nie problem gscrapera tylko proxy. Sam gscraper podmienia proxy z api przy harvescie bez zarzutów (testowałem).

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności