Skocz do zawartości

Polska konkurencyjna wyszukiwarka


daniek

Rekomendowane odpowiedzi

Algorytm mam w głowie

To może czas zaimplementować go do wyszukiwarki...

CPM Leader - Najlepsze Reklamy CPM w internecie...

AdFreestyle - Najlepsze Reklamy CPC w internecie...

CPM Fun - Najlepiej płatne Reklamy CPM w internecie...

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 151
  • Dodano
  • Ostatniej odpowiedzi

Netsprint się wycofał z wyszukiwania polskiego internetu, ale są inni, którzy mają jakieś cele i trochę grosza - może wszystkiego nie przepiją, ale co z tego wyjdzie, czas pokaże...

Cele projektu: www.ipipan.waw.pl/nekst/index.php/o-nekst/goal

Wartość projektu: 14.991.014 PLN

Udział Europejskiego Funduszu Rozwoju Regionalnego: 12.742.361 PLN

Beneficjent: Instytut Podstaw Informatyki Polskiej Akademii Nauk

Partner: Politechnika Wrocławska

Realizacja: 2009/04/01 - 2014/02/25

Odnośnik do komentarza
Udostępnij na innych stronach

14 milionów, to bym kilka razy google zbudował od nowa razem z kilkoma podległymi usługami :|

Ja chcę z wami właśnie taki algorytm otwarcie ułożyć i testować :)

No to jest fakt, muszę (musimy) popracować nad algorytmem, ale obawiam się, iż bez pewnych danych typu Page Rank, Alexa, Popularność strony... itp algorytm nie będzie aż tak trafny od samego początku. Tutaj są inne wytyczne użytkowe, że jeżeli z wyszukiwarki zaczynają korzystać użytkownicy w dość sporym natężeniu, to zaczyna ona mieć własne statystyki które strony są chętniej wybierane w wynikach. Po drugie, jeżeli wyszukiwarka nie ma zaindeskowanych wystarczająco wielu stron, nie może tworzyć własnych statystyk dla tych stron które ma w indeksie (np: obliczanie ilości linków przychodzących mogło by być wybiórcze i przekłamane). [Albo się mylę, gdyż moja druga teoria głosi, iż wybiórczość statyczna w pewnym stopniu od samego początku zaczyna odzwierciedlać całość ogółu.] Mam tutaj na myśli iż jeżeli dana strona A ma więcej BL niż dana strona B dla pewnej frazy to pierwszymi linkami BL na jakie powinien się naciąć bot pająk będą właśnie BL linki strony A. W tym przypadku mieli byśmy do czynienia z dość sprzyjającą sytuacją typowej próby statystycznej odzwierciedlającej cały internet bez indeksowania całego internetu. Weźmy np. wybory w Polsce. Zadzwonią do kilkuset lub kilku tysięcy osób i już wiedzą jak będzie wyglądać całość głosowania, a bazują na mikro próbie statystycznej.

Czy jakieś rozwiązania się komuś nasuwają?

I jest również dziwny problem : podajmy przykład.

Mamy stronę wp.pl i stronę wp.pl.domena.pl

I załóżmy iż strona wp.pl.domena.pl posiada lustrzany kod strony wp.pl to jak ma wyszukiwarka od samego początku zbanować wp.pl.domena.pl a na pierwszym miejscu ustawić dla szukanych fraz np. wirtualna polska akurat wp.pl - (podkreślam bez integracji i pobierania innych obcych danych w/w).

Co z tym fantem?

Odnośnik do komentarza
Udostępnij na innych stronach

to bym kilka razy google zbudował

to się postaraj o dofinansowanie z poig...

Ja chcę z wami

na początek, jeśli masz jakiś crawler do przeczesywania stron to się jakoś przedstawiaj, bo na udawaniu przeglądarki czy anonima to w nas sobie najwyżej wrogów zrobisz...

bez pewnych danych typu Page Rank, Alexa, Popularność strony

to je pobierz lub zbuduj - w zależności od potrzeb i założeń...

załóżmy iż strona wp.pl.domena.pl posiada lustrzany kod strony wp.pl to jak ma wyszukiwarka od samego początku zbanować wp.pl.domena.pl

w takiej sytuacji to akurat banalnie łatwo problem rozwiązać - nie sądzisz?

Odnośnik do komentarza
Udostępnij na innych stronach

OK.

POIG wspiera milionerów. Odpowiedź z pewnych dotacji innowacyjnych projektów z waraszawy brzmiała : po co budować inną niż google wyszukiwarkę. Jeżeli ktoś się zna na PIOG i umie przechodzić te ich wnioski to zapraszam do współpracy.

Co do clawlera to wiem, w następnej wersji będzie się przedstawiał.

Co do seo. Jak pobrać SEO statystyki na temat 100 milionów domen (np pagerank, alexa, site w google, itp)?

Oczywiście że podany przykład o wp.pl to tylko przykład. W sytuacji pobrania jakichkolwiek danych SEO będzie on rozwiązany ale jak rozwiązać taki problem bez danych zewnętrznych?

strona a.pl

strona b.pl

Strona b.pl to kopia kodu strony a.pl - jak rozpoznać która jest własciwa.

Jest na to bardzo wiele mołżiwości, ale jak to zrobić bez korzystania z innych danych jak kod i adres.

Odnośnik do komentarza
Udostępnij na innych stronach

Jak pobrać SEO statystyki na temat 100 milionów domen (np pagerank, alexa, site w google, itp)?

Tak samo jaka dla 10... 100 ... 10 n. Kwestia skali zależy od ilości proxy i czau pobierania danych.

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Jeżeli ktoś się zna na PIOG i umie przechodzić te ich wnioski to zapraszam do współpracy.

są firmy specjalizujące się w takich rzeczach - jak czegoś nie umiesz, to to zlecasz...

w następnej wersji będzie się przedstawiał

czyli może za 100 lat? ;)

Jak pobrać SEO statystyki na temat 100 milionów domen

na tych samych zasadach jak dla 100...

to tylko przykład
Jest na to bardzo wiele mołżiwości, ale jak to zrobić bez korzystania z innych danych jak kod i adres

to znowu też tylko przykład, który można rozwiązać na przynajmniej parę sposobów...

Jeśli chcesz omawiać swoją wyszukiwarkę, to może załóż jej osobny wątek, przedstaw swoje pomysły i może ktoś je oceni.

W tym momencie mam wrażenie, że czekasz, aż ktoś przedstawi Ci swoje pomysły, a te akurat są często najcenniejsze...

Odnośnik do komentarza
Udostępnij na innych stronach

Nie chcemy być jak google

VS

iż bez pewnych danych typu Page Rank, Alexa, Popularność strony... itp algorytm nie będzie aż tak trafny od samego początku

Wiec piszecie własną wyszukiwarkę czy [...] :nie_powiem:

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Wiec piszecie własną wyszukiwarkę czy

...nic z tego nie będzie :)

CPM Leader - Najlepsze Reklamy CPM w internecie...

AdFreestyle - Najlepsze Reklamy CPC w internecie...

CPM Fun - Najlepiej płatne Reklamy CPM w internecie...

Odnośnik do komentarza
Udostępnij na innych stronach

  • 4 tygodnie później...

W chwili obecnej nie jestem wstanie wesprzeć tego rozwiązania, ale będę uważnie śledził jego rozwój. Być może w przyszłym roku znajdę jakieś pieniądze na wsparcie inicjatywy. Na razie muszę własny biznes rozwinąć.

Kilka punktów od których powineneś zacząć.

1. Tylko jeden adres strony jeżeli masz możliwośc zakup rozszerzenie z com i resztę przekieruj.

2. Załóż oficjalny serwis wspierający, który będziesz promował i prosił w nim o wpsracie inicjatywy, myślę że koledzy SEO 100 PLN miesięcznie na dobry początek wrzucą, ja jak najbardziej jestem chętny.

3. Wywal wszystkie reklamy, które się wyświetlają. Po wyszukaniu 2/3 wyników powoli to odstraszyło, ale wewnętrzny "patriotyzm" wygrał .

4. Usuń logowanie przez facebook i inne serwisy społecznościowe im googiel później się o tobie dowie tym lepiej. Obecnie nawet nie zwraca na ciebie uwagi.

4a. Usuń się z wyników wyszukiwania googla.

5. Załóż własną pocztę z np. frogmail :) Z chęcią założe konto na frogmail zamian na gmail.

5a. Posiadając bazę maili możesz sprzedawać reklamy, na których będziesz zarabiał aby wesprzeć pracę nad swoim projektem.

6. Załóż katalog stron interentowych - nigdzie nie ideksowany. Wrzuć reklamę na PIO, każdy z nas doda kilka swoich wartościowych, zapleczowych serwisów. - tutaj mogę ci pomóc zajmę sie moderowaniem katalogu.

6a. W ten sposób utworzysz bazę, na której będziesz mógł testować swoje narzędzie. Poprawiać algorytm, tak aby lepiej dopasowywał wpisaną frazę. Optymalizować roboty, zwiększać ich ilość, na bierząco badać sposób indeksowania fraz. Usuwać błędy.

6b. Na dobry początek spokojnie 10 000 wartościowych domen uzbieramy wspólnymi siłami. - mam na myśli użytkowników PIO którzy chcą aby google trochę rynku utraciło.

7. Stwórz odrębny darmowy katalog firm, kórych wyniki będą widoczne w twojej wyszukiwarce.

Jak jeszcze sobie coś przypomnę to dam ci znać. Ubiegając pytanie, będę wspierał frogile w w lace z google, ze względu na ostatnie zmiany wprowadzone u giganta a dotyczące wyszukiwanych słów kluczowyc przez użytkowników, które mają być niedostepne. Dla pozycjonerów jest to ogromny cios, ale zakładam że do przejścia. Natomiast dla zwykłych webmasterów, którzy mają kilka serwisów i chcą zarobić pare groszy, jest to gwóźdź do trumny. Swój sklep internetowy miałem reklamować w Google AdWords - ale wiadomośc, która dziś do mnie dotarała przechyliłą czarę goryczy. Są jeszcze możliwe inne sposoby na reklamę serwisów i będe z nich korzystał.

Teraz google wyłącza możliwość ogladania słów kluczowych, a jutro będzie wyrzucał strony, które używają innych reklam, niż AdWords, potem wyrzuci wszystkie katalogi z wyników wyszukiwania i zostawi tylko swój, jedyny słuszyny katalog. Aż w końcu tak jak ktoś wcześniej pisał google stanie się internetem.

Odnośnik do komentarza
Udostępnij na innych stronach

8. Dodaj katalog - SEO katalogów - na którym będziesz tesotował filtr stron zakazanych, głównie erotycznych. Warto to robić na oddzielnej wyszukiwarce, aby wyniki nie zaśmieciły stron i filtrów.

9. Dobrze byłoby aby katalogi były płatne, myśle że 2-5 PLN za wpis to nie duży pieniążek, a to znowu jakaś gotówka na działanie.

10. Nie promuj jeszcze wyszukiwarki wśród uzytkowników, nie jest na to czas. Im więcej godzin spędzisz na testach, tym lepiej ale do tego potrzebna jest gotówka i ludzie.

11. Nazwa kojarzy się z mozillą więc może warto zastanowić się nad czymś innym.

Google doskonale wie, że to zwykli użytkownicy internetu, nie mający pojęcia o SEO są jego motorem napędowym. Wie też, że SEOwcy w pojedynkę nic nie zrobią. Ale jeżeli wszyscy najlepsi SEOwcy z Forum PIO i największe firmy SEO zaczną wspierać rozwój alternatywnego narzędzia, to googiel nie pociągnie.

Wystarczy stopniowo do swojej oferty wkładać pozycjonowanie we frogili na początku 1% kampanii aż do 50%.

A za kilka lat, świat będzie szumiał o tym jak Polacy wykoczylili Google Polska. Może i utopia, ale już nie jeden serwis pokazał, że polskie rozwiąznia nie są gorsze od zachodnich. Choćby przytoczone wcześniej Allegro :)

Warto też zablokować ten temat dla robotów Googla :)

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności