Skocz do zawartości

W czym najlepiej pisać spidera?


sbvc

Rekomendowane odpowiedzi

Jak myślicie w jaki sposób należy napisać spidera, który indeksuje materiały z serwisów ala youtube.com, wrzuta.pl, live.com itd?

1) W php - odpalam na stronie, jednak jestem ograniczony czasowo (co jakiś czas przerywa wykonywanie skryptu). Według mnie pomysł do bani. ;)

2) W delphi/c++/java itp. - odpalam na dysku, a program wysyła gotowe dane do mysql. Ograniczony jestem prędkością transmisji - w moim przypadku 512 kb/s.

Zakładana liczba potrzebna do uruchomiania strony to 1mln materiałów.

Jestem ciekaw waszej opinii jak Wy byście to zrobili. Jak myślicie ile zajmie indeksacja jeśli wszystko odpalę przez program?

Odnośnik do komentarza
Udostępnij na innych stronach

php możesz odpalać z konsoli i ustawić czas wykonania na 0 czyli nieograniczony choć jeszcze zależy jak jest na serwerze skonfigurowany, zawsze możesz też co 1 minutę z crona odpalać

zależnie od hostingu ale programy w c/c++ czy servlety javy możesz odpalać na serwerze nie wspominając już o tym że najlepszy byłby własny dedyk gdzie konfiguracja zależy od Ciebie,

IE to taki program, który pozwala na oglądanie internetu z Twojego komputera i odwrotnie...

Odnośnik do komentarza
Udostępnij na innych stronach

W czym najlepiej pisać spidera?, Oczywiście nie mam na myśli spidera wyszukiwarki :)

Najlepiej napisać go w LOGO albo Atari BASIC :D

Sklep dla sportowców w którym znajdziesz Odżywki oraz suplementy diety dla sportowców, sprzęt siłowy i fitness oraz akcesoria do sportów walki i treningowe Hurt-Detal. Szybka wysyłka na terenie polski i za granicę.

Sklep producenta sprzętu siłowego, fitness oraz akcesoriów do sportów walki. Wysoka jakość, przystepne ceny :)

Odnośnik do komentarza
Udostępnij na innych stronach

żółwik rządzi :D

A tak poważnie to oczywiści język typu c/c++ będzie znacznie szybszy chyba że można za pomocą zenda przyspieszyć php, niestety jednak napisanie w c/cpp jest dużo bardziej skomplikowane

IE to taki program, który pozwala na oglądanie internetu z Twojego komputera i odwrotnie...

Odnośnik do komentarza
Udostępnij na innych stronach

Ja zawsze piszę takie rzeczy w Perlu. Pisanie w C++ nie ma żadnego sensu bo program i tak jest ograniczony szybkością łącza internetowego a nie wydajnością procesora, więc nic na szybkości się nie zyska. A Perl ma mnóstwo wbudowanych funkcji do parsowania tekstów, które się bardzo przydają przy indeksowaniu zawartości stron WWW.

Odnośnik do komentarza
Udostępnij na innych stronach

Najlepiej pisać w tym jezyku który sie zna biegle :)

Nie widzę zadnych przeciwskazań co do PHP, wszak strona może sie automatycznie odświeżać.

Jak otworzysz w kilku zakładkach to robisz aplikację wielowątkową :D:) :)

Można też to zrobić bez odświeżania wszak jest SET TIME LIMIT = 0

Odnośnik do komentarza
Udostępnij na innych stronach

Odnośnie szybkości działania to istnieje kompilator dla php pozwalający na skompilowanie kodu napisanego w tym języku do binarki ale niestety nie wiem jakie będą różnice kodu wynikowego skompilowanego programu w c++ i php kompilatorem. Sama kompilacja w c++ pewnie się będzie różnoić pod względem szybkoświ w zależności jakiego kompilatora uzyjemy (cc, gcc, borlanda czy jeszcze czegoś innego) oraz jakich flag uzyjemy podczas kompilacji.

Użyj tego co znasz najlepiej do pisania spidera, a zwróci się to tobie mniejszą ilością bugów w nim :D

Sklep dla sportowców w którym znajdziesz Odżywki oraz suplementy diety dla sportowców, sprzęt siłowy i fitness oraz akcesoria do sportów walki i treningowe Hurt-Detal. Szybka wysyłka na terenie polski i za granicę.

Sklep producenta sprzętu siłowego, fitness oraz akcesoriów do sportów walki. Wysoka jakość, przystepne ceny :)

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności