Skocz do zawartości

Tajemnice harvestowania


shift76

Rekomendowane odpowiedzi

Witam

Zaczynam swoją przygodę z harwestowaniem. Przenoszę to pytanie z tematu Miona, bo mu lekko zaśmieciłem wątek a poza tym liczę na szybszą odpowiedź:). Generalnie liczę na pomoc speców od Scrapeboxa czy właśnie pakiet Miona USM. Obecnie skupiam się na poszukiwaniu blogów AA Wordpress. Mam w związku z tym kilka pytań:

1. Czy te blogi WP powinny być krajowe czy to bez różnicy?

2. Jeśli blog jest obcojęzyczny to czy dodawany tekst powinien być w języku takim jak blog czy po polsku?

3. Czy podczas harwestowania powinienem dodać frazy kluczowe i jakie. Jest to obojętne, byle więcej wyników, czy wręcz odwrotnie szukam blogów tematycznych?

4. Co jest głównym parametrem wyboru oprócz tego iż uda mi się zarejestrować taki blog w BlogiSubmitter i dodać artykuł? PR? Rok założenia? ....

5. Czy podczas sprawdzania możliwości rejestracji kont na blogi w BS mam robić to na domenach głównych blogów czy mogą być wyharwestowane podstrony? Jak jest lepiej i jak to się powinno aby efekt rejestracji był efektywniejszy?

6. W tej chwili korzystam z m.in takich footprintów:

site:.edu" "Powered By Wordpress" + "keyword"

"powered by wordpress"

"keyword" + "powered by wordpress"

"proudly powered by WordPress MU and BuddyPress" inurl:/register intext:username

"Leave a Reply" "Name" "(required)" "Mail (will not be published)" "(required)"

inurl:wp-login.php?action=register

"Proudly powered by WordPress" wp-login.php?action=register

"Leave a Reply" "Name (required)" "Mail (will not be published) (required)" "Website" wp-login.php?action=register

"Leave a Comment" "Name" "Website" wp-login.php?action=register

"name" + "email" + "powered by wordpress"

Inurl:.edu ?Powered by wordpress"

Inurl:.gov ?Powered by WordPress"

Inurl:.pl ?Powered by wordpress"

"proudly powered by WordPress MU and BuddyPress" inurl:/register intext:username

allinurl: wp-login.php?action=register site:.pl

Czy to dobry kierunek czy raczej obok tarczy, bo wyniki jakieś takie nie wordpresowe, niektóre.

Będę bardzo wdzięczny za podpowiedź.

Maciej

Odnośnik do komentarza
Udostępnij na innych stronach

6. Jak chcesz zbierać Wordpressa to odpuść sobie footprinty. Zbierz jak największą ilość keywords i jeżeli masz Scrapeboxa harvestuj ile się tylko da w Yahoo na publicznych proxy. Jak zbierzesz kilkadziesiąt milionów unikalnych domen przejdź do Link Checkera i wpisz do niego wp-content to odkroi Ci same Wordpressy, których w internecie jest ok 1/4, także troszkę z tego będzie. Następnie w notepad++ za pomocą regexp (ctrl+h, zaznaczasz w lewym dolnym rogu regular expression i wpisujesz w Find what: (.*?)$ oraz Replace width: \1/wp-login.php?action=register) dodaj do każdego url-a /wp-login.php?action=register i przeleć ponownie Link Checkerem wpisując tym razem name="registerform i odnajdziesz te strony w których możesz się zarejestrować.

Odnośnik do komentarza
Udostępnij na innych stronach

Witam

Z odfiltrowaniem wyników to już sobie jakoś poradzę, tylko trzeba mieć co odfiltrować :). Serio mam zapomnieć o footprinatach i zbierać wordpressy w yahoo? Brzmi łatwo tylko tylko czy skutecznie? Czy otrzymane wyniki będą wartościowe?

Masowe wykorzystanie footprint w Google inurl praktycznie graniczy z cudem a w innych wyszukiwarkach nie ma tak precyzyjnych operatorów, aby móc już na poziomie harvestu zrobić odsianie skryptów (a przynajmniej ja jeszcze do nich nie doszedłem), także aby coś więcej uzbierać wydaje mi się, że tylko zebranie całości może pomóc.Yahoo jeszcze tak nie blokuje szybko proxy jak inne wyszukiwarki, także coś tam jeszcze można ugrać.

Odnośnik do komentarza
Udostępnij na innych stronach

mam je wymyślić czy jest jakiś automat do ich generowania? A może jeszcze inny sposób?

Klik

Lista angielskich fraz (930k) mających nie więcej niż 3 słowa.

Masowe wykorzystanie footprint w Google inurl praktycznie graniczy z cudem

Kwestia ilości proxy jakie posiadasz. Wystarczy pakiet 300proxy z proxymarket albo wiedza jak samemu sobie zorganizować taką ilość proxy. W obu przypadkach jednak należy się liczyć z kosztem rzędu XXX pln miesięcznie.

Odnośnik do komentarza
Udostępnij na innych stronach

1. Czy te blogi WP powinny być krajowe czy to bez różnicy?

Bez różnicy.

2. Jeśli blog jest obcojęzyczny to czy dodawany tekst powinien być w języku takim jak blog czy po polsku?

Bez różnicy.

3. Czy podczas harwestowania powinienem dodać frazy kluczowe i jakie. Jest to obojętne, byle więcej wyników, czy wręcz odwrotnie szukam blogów tematycznych?

Footprint plus słownik - to podstawa zbierania wyników.

Nie szukasz stron tematycznych, szukasz na linki.

4. Co jest głównym parametrem wyboru oprócz tego iż uda mi się zarejestrować taki blog w BlogiSubmitter i dodać artykuł? PR? Rok założenia? ....

To, że uda Ci się "zapostować" i nic więcej.

5. Czy podczas sprawdzania możliwości rejestracji kont na blogi w BS mam robić to na domenach głównych blogów czy mogą być wyharwestowane podstrony? Jak jest lepiej i jak to się powinno aby efekt rejestracji był efektywniejszy?

Tego akurat nie pamiętam, ale programy Miona mają dobre "przewodniki".

Aby efekt był, należy zrobić kilka przebiegów listą o różnych porach dnia.

6. W tej chwili korzystam z m.in takich footprintów:

site:.edu" "Powered By Wordpress" + "keyword"

"powered by wordpress"

"keyword" + "powered by wordpress"

"proudly powered by WordPress MU and BuddyPress" inurl:/register intext:username

"Leave a Reply" "Name" "(required)" "Mail (will not be published)" "(required)"

inurl:wp-login.php?action=register

"Proudly powered by WordPress" wp-login.php?action=register

"Leave a Reply" "Name (required)" "Mail (will not be published) (required)" "Website" wp-login.php?action=register

"Leave a Comment" "Name" "Website" wp-login.php?action=register

"name" + "email" + "powered by wordpress"

Inurl:.edu ?Powered by wordpress"

Inurl:.gov ?Powered by WordPress"

Inurl:.pl ?Powered by wordpress"

"proudly powered by WordPress MU and BuddyPress" inurl:/register intext:username

allinurl: wp-login.php?action=register site:.pl

Czy to dobry kierunek czy raczej obok tarczy, bo wyniki jakieś takie nie wordpresowe, niektóre.

Nie używaj inurl.

Żaden harvest nie daje precyzyjnych wyników, jego jakość zależy od dopacowania zapytań.

Aby przygotować listę do pracy, wyniki każdego harvestu należy obrobić/przesiać.

M

Strona https://sklep-promar24.pl to sklep internetowy sprzedający dobre polskie zlewozmywaki.

Odnośnik do komentarza
Udostępnij na innych stronach

Dzięki Mariusz za wyczerpujące informacje:)

W tej chwili próbuje skorzystać z rady ~larry i nie bawić się w footprinty tylko harwestować yahoo. Cały czas dopasowanie footprintów sprawia mi olbrzymią trudność, może jak trochę potrenuje to jakoś to ogarnę, albo się ktoś zlituje i mi je przygotuje:)

Odnośnik do komentarza
Udostępnij na innych stronach

-> ~larry - Zbierz jak największą ilość keywords... mam je wymyślić czy jest jakiś automat do ich generowania? A może jeszcze inny sposób?

Bierzesz listę 1000 najpopularniejszych słów angielskich i wrzucasz je po kolei do Scrape Keywords w Scrapeboxie. W ten sposób zdobędziesz kilkadziesiąc milionów unikalnych keywordów. Jeżeli jeszcze nie masz to zainwestuj w płatny addon Automator w Scrapeboxie (20$), który znacznie usprawni Ci ten proces.

Odnośnik do komentarza
Udostępnij na innych stronach

a jak dodac za pomocą notepad by we wszystkich domenach dodawało: /wp-login.php?action=register ?

Notepad++:

Szukaj->Zamień (Ctrl+H)

Ustaw tryb szukania na "Rozszerzony" i zamień:

\r\n

na

/wp-login.php?action=register\r\n

i kliknij "Zamień wszystkie"

Ewentualnie jeśli masz inne zakończenia linii to zamiast "\r\n" daj "\n".

Odnośnik do komentarza
Udostępnij na innych stronach

Zdam mały raport. Więc zgodnie z sugestią ~larry zacząłem zbierać wyniki z Yahoo. Niestety nie miałem listy 1000 słów, wymyśliłem około 50, wstawiłem do Scrape Keywords i zacząłem harewestowanie. Uzbierałem około 100tys wyników. Za pomocą seo-odkurzacza przefiltrowałem wyniki ustawiając 2-3 podstawowe filtry. Wyniki wstawiłem do Blogi Submitter i zacząłem testowanie rejestracji. Lista stanowczo się skurczyła. Dalej dokonałem rejestracji w skurczonej liście, co spowodowało kolejne obcięcie wyników. Do tak przygotowanej listy rozpocząłem testowe dodanie artykułu. I ku mojemu zdziwieniu, ilość dodań = 0. Trwało to 2 dni.

~larry, skąd mam wziąć te listę najpopularniejszych angielskich słów?

Odnośnik do komentarza
Udostępnij na innych stronach

Zdam mały raport. Więc zgodnie z sugestią ~larry zacząłem zbierać wyniki z Yahoo. Niestety nie miałem listy 1000 słów, wymyśliłem około 50, wstawiłem do Scrape Keywords i zacząłem harewestowanie. Uzbierałem około 100tys wyników. Za pomocą seo-odkurzacza przefiltrowałem wyniki ustawiając 2-3 podstawowe filtry. Wyniki wstawiłem do Blogi Submitter i zacząłem testowanie rejestracji. Lista stanowczo się skurczyła. Dalej dokonałem rejestracji w skurczonej liście, co spowodowało kolejne obcięcie wyników. Do tak przygotowanej listy rozpocząłem testowe dodanie artykułu. I ku mojemu zdziwieniu, ilość dodań = 0. Trwało to 2 dni.

~larry, skąd mam wziąć te listę najpopularniejszych angielskich słów?

Proszę https://chomikuj.pl/florecita/Angielski/1000+Najpopularniejszych+S*c5*82*c3*b3w+w+j*c4*99zyku+angielskim,94088349.xls

Odnośnik do komentarza
Udostępnij na innych stronach

100 tysięcy wyników to trochę mało. Wordpresów AA jest coraz mniej, także, aby zebrać listę w ten sposób musisz zebrać o wiele więcej danych. Ja w swojej bazie mam aktualnie 3 mln samych WP i teoretycznie mógłbym Ci je udostępnić, ale zapewniam Cię, że lepiej będzie jak sam się nauczysz harvestu, bo ta umiejętność przyda Ci się nie tylko do SEO.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności