Skocz do zawartości

Tematyczność linków w google


Xann

Rekomendowane odpowiedzi

....

Czy tak trudno zrozumieć, że posiadam na dysku wszystkie polskojęzyczne strony główne + po 2-3 podstrony z każdej (sub)domeny, razem ponad 800 GB....

mógłbym wiedzieć skąd wiozłeś adresy wyszyskich polskich stron, gdzie one są dostępne ?

Marketing internetowy dla firm

 

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 156
  • Dodano
  • Ostatniej odpowiedzi

Z linków, tak samo jak robi to Google.

Mam crawler napisany w C++, który ściąga strony według linków i zapisuje do bazy Firebird.

Jak trafia na link do np. https://www.forum.optymalizacja.com/index.php?showtopic=77824, to dodaje forum.optymalizacja.com i optymalizacja.com do kolejki.

Czy polskie czy nie - od określania tego jest TextCat.

Odnośnik do komentarza
Udostępnij na innych stronach

Z linków, tak samo jak robi to Google.

z linków ???

czyli puszczasz takiego "pajączka" w świat ktory chodzi po linkach bo przecież wszyskie strony na całym swiecie są zlinkowane miedzy sobą i sprawdza ktore polskie strony ;)

no dobra - mi już wystarczy, masz Ty wyobraźnie :)

ps. pochwal się tą cyfą ile ich masz na tym twardym dysku ?

Marketing internetowy dla firm

 

Odnośnik do komentarza
Udostępnij na innych stronach

czyli puszczasz takiego "pajączka" w świat ktory chodzi po linkach bo przecież wszyskie strony na całym swiecie są zlinkowane miedzy sobą i sprawdza ktore polskie strony :)

1. Co to ma wspólnego z tematem, czyli z tematycznością linków w Google?

2. Crawler wchodzi najpierw na strony podane przeze mnie, następnie na strony linkowane z tych stron i tak w nieskończoność. Jak któraś strona nie jest polska, to jej treści nie zapisuje w bazie ani nie podąża za linkami z niej (bo strony linkowane najprawdopodobniej też nie są po polsku).

Przecież to jest bardzo proste, Netsprint, Szukacz, Gooru i inni tak robią.

Liczba stron - 30 597 886.

Odnośnik do komentarza
Udostępnij na innych stronach

  • 1 miesiąc temu...

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności