Skocz do zawartości

Szook.pl ver beta


Daniel Kędzierski

Rekomendowane odpowiedzi

Witam,

Na początek z małą prośbą do adminów:

Czy można stworzyć na forum podforum o nazwie inne wyszukiwarki bądź projekty użytkowników, tak by można było omawiać dany projekt bez konieczności otwierania różnych tematów w przypadkowym miejscu.

----------------------------------------------------------------------------------------------------------------------

Następnie chciałbym zaprosić do dyskusji nad nową wersją która wprowadzona będzie 1 czerwca.

Nowy robot przedstawia się jako UA: Szook.pl 1.5 beta

Główne zmiany które wprowadziłem to:

indeksacja podstron do głebokości - 2 klika

grupowanie wyników jeżeli dana strona występuje więcej niż kilka razy dla danego zapytania.

podpowiedź w razie błędnego zapytania.

analiza strony i szukanie wg synonimów, odmiany, słów pochodnych i tematycznych

tłumaczenie zapytania z języka angielskiego na polski, co ułatwi użytkownikówi nie znającemu języka polskiego odnajdywanie informacji na stronach polskich.

Np wpisując "positioning" silnik będzie wyszukiwał słowa "pozycjonowanie" i pochodne, zamieniając także to słowo w wynikach wyszukiwania na wersje angielską w celu ułatwienia rozpoznania strony.

Chciałbym wprowadzić jeszcze kilka dodatkowych opcji pomocnych przy wyszukiwaniu

i tutaj chętnie wysłucham wskazówek względem modyfikacji.

Aktualna wersja beta jest ubogim indeksem który jest w trakcie budowy

może chodzić powoli bowiem non stop trwa indeksacja nowych podstron w maksymalnej ilości.

wyniki mogą także nie być jeszcze doskonałe z uwagi na małą ich ilośc, brak włączonych filtrów w celu dojścia do największej ilości podstron.

To przykład wyników wyszukiwania z grupowaniem wyników dla domeny i przeszukiwania jej pod kątem zawieranego słowa.

Dlatego też indeks danej domeny może być większy niż wykazuje szukaj w, bowiem szukaj w odbywa się dla określonej frazy.

przykład: https://www.szook.pl/b.php?p=wirtualna+warszawa

Ten przykład pokazuje co się stanie gdy zamiast słowa PORCELANA wpiszemy słowo PARCELANA

przykład https://www.szook.pl/b.php?p=parcelana

tutaj można zobaczyć wstępną wersje tłumaczenia zapytań

https://www.szook.pl/b.php?p=positioning

dla zapytania EN positioning został zwrócony wynik ze stronami zawierającymi słowo pozycjonowanie.

wstępnie tłumaczony w wynikach jest tytuł - będzie także opis.

przykład: https://www.szook.pl/b.php?p=positioning

Czekam na wasze wskazówki względem dodatków przydatnych w wyszukiwaniu.

co do jakości wyników to jest ona daleko w tyle, ale z czasem się poprawi.

Pozdrawiam

Odnośnik do komentarza
Udostępnij na innych stronach

tłumaczenie zapytania z języka angielskiego na polski, co ułatwi użytkownikówi nie znającemu języka polskiego odnajdywanie informacji na stronach polskich
Jeżeli ktoś nie zna języka na tyle żeby wpisać zapytanie po polsku, to jak ma sobie przeczytać zawartość znalezionych stron?

Masz deklarację ISO a wyniki w kodowaniu UTF

Nie znam się na pozycjonowaniu, ja tu tylko zużywam transfer i miejsce w sql.

Roman Kluska ujawnia: nadchodzi INFLACYJNY ARMAGEDON!

 

Wielki Elektronik

Odnośnik do komentarza
Udostępnij na innych stronach

Zgadzam się z Tobą,

Ale docelowo będę pracował nad translatorem bądź nad zakupem, który po kliknięciu będzie miał za zadanie ją przetłumaczyć, bądź będzie przekierowanie gdzie taką strone można przetłumaczyć.

Najważniejsze żeby użytkownik nie znający języka najpierw odnalazł odpowiednią stronę.

Chciałbym też wprowadzić wersję niemiecką, bo dośc sporo niemieckich zapytań np o noclegi, nieruchomości w polsce itp. jest zadawana w języku niemieckim a jednak nie wszystkie strony posiadają wersje niemiecką.

Ale zbudowanie słownika niemieckiego zajmie mi około 3-6 miesięcy więc to odległy temat.

Wyniki mam w ISO, jednak muszę dopracować indeksera który podczas napotkania strony w UTF zamieni odpowiednie znaki na ISO.

Dlatego też przy stronach kodowanych w UTF obecnie występują znaczki

https://www.szook.pl/b.php?p=suknie+%B6lubne

Lecz stron w UTF jest znikomy procent w stosunku do ISO-2 - bowiem UTF jest dość starym ogólnie stosowanym kodowaniem, większośc PL stron koduje w ISO. Ale jeżeli będzie tego znaczna większośc napisze kilka linijek kodu który zamieni krzaczki na stronach z UTefem.

Jednak najważniejszym zadaniem będzie dla mnie całkowita eliminacja stron ero, farmaceutyka,inne zakazane.

Odnośnik do komentarza
Udostępnij na innych stronach

... stron ero, farmaceutyka,inne zakazane.

Zdefiniuj "inne zakazane" jeśli możesz...

Naprawdę odcinasz się od tych co szukają lekarstwa na ból głowy (bidna ta Goździkowa) oraz chcą kupić dobrą bieliznę i baloniki? :)

Każde filtrowanie prowadzi często do nieoczekiwanych efektów!

Tutaj będą zaj...iste trzy linki...

Odnośnik do komentarza
Udostępnij na innych stronach

Wi777

nie :) no nie o gozdzikowej myslałem.

typu viagra prozac itp.

Ero to typowe hard, strony soft będą czyli np w sposob delikatny poruszajace taką tematykę a ni że wielkie piz.....sko wyskoczy na cały ekran :)

Zakazane - to promujące przemoc, narkotyki, nakłaniające do przestępwstwa.

Dodatkowo bedzie wyszukiwanie polaczone z pasazem ze strony www.kupujtu.eu na którym sklepy internetowe będą mogły bezpłatnie dodawać swoje produkty.

Tak by pozniej podczas np szukania:

meble , bielizna, ziemniaki, pojawił się w wynikach także bezpośredni odnośnik do produktu z miniaturką a nie do domeny.

Czyli w pozniejszym czasie będzie to polaczone z wyszukiwaniem produktów.

Na razie testuje kontekstualne dopasowanie produktu na podstawie słów kluczowych do zawartości strony, lecz muszę dopracować baze synonimów, słów pochodnych odmian itp.

Odnośnik do komentarza
Udostępnij na innych stronach

tzn. narazie to zadna wpadka.

Obecnie indeksuje max duzo, max wszystko bez filtrów, ale tylko po to aby pozniej pewna czesc wyfiltrowac.

Robie tak aby dojsc do jaknawiekszej ilosci urli, ktore mozniej stana sie matkami nowych urli, chore matki wyleca, zostaną zdrowe ktore dadza zdrowe dzieci, i tak w koło :cray:.

Dlatego do 1 bedzie indeksacja bez zadnego limitu i filtra. czyli MAX MAX MAX a pozniej poleci 1 filtr sprawdze stan, 2 filtr sprawdze stan itd.

Sprawdz juz na poczatek obok linka taki przycisk z lupka, to tylko wstepna analiza meta.

Jezeli po takiej analziei cos pojawi sie na pomaranczowo to oznacza ze docelowo taka domena kiedys zniknie.

A druga sprawa ty ogladales wersje starą która działa obecnie

BETA jest pod b.php

https://www.szook.pl/b.php?p=katalog+stron

działa very powoli bowiem na tych serwerach idzie pająk.

Odnośnik do komentarza
Udostępnij na innych stronach

dzisiaj przygotowuje 1 filtr dla stron.

I teraz mam pytanie:

Zakladamy ze jest domena xxxxx.pl wlasciciel posiada np 3 subdomeny.

Na domenie glownej jest spam na subdomenie nie - ban na domenę ?

lub odwrotna sytuacja:

na domenie glownej brak spamu na subdomenie spam.

Generalnie uwazam ze wlasciciel jest swiadomy co posiada na subdomenie i subdomenę można równie dobrze traktować jak podstronę, tym samym powinno się filtrować całość tak jakby tl byla podstrona serwisu.

Wnioskuje tak z uwagi że subdomena nalezy do wlasciciela domeny.

A moje pytanie to takie : Co sądzicie o filtrowaniu całej domeny jeżeli na podstronie/domenie lub subdomenie znajdą się techniki któe wyłapie filtr.

Odnośnik do komentarza
Udostępnij na innych stronach

Jak dla mnie to pomysł bardzo dobry, ale może warto byłoby wyłączyć z tego filtra domeny należące do systemu aliasów: prv.pl, glt.pl itp...

Program do nauki na uprawnienia budowlane i przygotowujący do egzaminu na uprawnienia budowlane.

Okulary przeciwsłoneczne polaryzacyjne oraz okulary antyrefleksyjne zerówki do pracy przy komputerze.

Największy wymarzony kamper barbie fbr34 firmy mattel.

Odnośnik do komentarza
Udostępnij na innych stronach

thor.

Tzn dla aliasów założyłem możliwość inną.

Czyli będzie generalnie blokada na swobodne zaindeksowanie.

Lecz strony z aliasów po moderacji będą dodawane.

W przypadku zblokowanania domeny i gdy nie bedzie to system aliasowy, nie bedzie nawet moderacji czyli najpierw dam możliwośc zaznaczenia opcji że to jest domena z systemów alias.

Jeżeli będzie taki alias figurował w spisie jako system domena zostaniew dodana, w innym wypadku jak bedzie na liscie ban to nie, jak nie bedzie jej w obu bazach to zostanie wyslana do moderacji.

Najwieksza bolączka to jest taka że ludzie robią mase powtorek w title, desc, keywords, co 3 strona wg filtra opusci na dniach baze.

Odnośnik do komentarza
Udostępnij na innych stronach

Zapraszam do testowania Sugerowania wyszukiwanych słów.

Działa pod IE napewno, pod Liskiem chyba nie.

Podaje 15 sugerowanych podpowiedzi jezeli zaczniemy wpisywać słowo w oknie zapytania.

Działa na bazie słów w bazie + wyszukiwanych słów. Ilośc słów aktualizuje się online.

Dostępne do testow tylko ze strony głównej

Odnośnik do komentarza
Udostępnij na innych stronach

Generalnie uwazam ze wlasciciel jest swiadomy co posiada na subdomenie i subdomenę można równie dobrze traktować jak podstronę, tym samym powinno się filtrować całość tak jakby tl byla podstrona serwisu.

[...]

Co sądzicie o filtrowaniu całej domeny jeżeli na podstronie/domenie lub subdomenie znajdą się techniki któe wyłapie filtr.

A co z :

site:boo.pl

site:webd.pl

a nawet

site:nazwa.pl

i podobnymi hostingami ... ? A trochę ich jest.

Odnośnik do komentarza
Udostępnij na innych stronach

to chyba wszystko kwestią jest ile na dajen domenie subdomen bedzie mialo jakies zakazane bzdety.

Zauwaz ze swojego czasu w google za spam na subdomenach darmowych interii poleciala cala czesc interii darmowej w tym masa kont komercyjnych. Jakos to tam sobie zalatwili ze to wrociło.

Tak czy tak, to chyba zalezy jak nagminnie jest to robione.

Pozatym google moze sobie pozwolic na indeksowanie wszystkiego i całą mase, ja mam zasoby słabe tym samym muszę wyselkcjonowac 1% internetu który zmieści się w mojej bazie.

I mam jeszcze jeden pomysl:

Ale nie wiem jak podzielic strony:

czyli szukaj wszedzie:

szukaj w stronach komercyjnych

szukaj na stronach prywatnych

szukaj na stronach urzędowych

i co jeszcze dodać ? jak dzielic, czy moze podzielic to na regiony ?

Oczywiscie jako opcje do zaznaczenia ogolnie bedzie szukalo w calej bazie

Odnośnik do komentarza
Udostępnij na innych stronach

tomick moderacja.

Tzn osobna moderacja i nie wszystkich, z boku buduje katalog ktory bede silnie moderował.

I przy tej okazji mógłbym przypsiac url do danej grupy strony.

Dlatego też dotyczyłoby to tylko pewnej grupy stron czyli tej zmoderowanej z katalogu który odpale w przyszłym tygodniu.

Z taką różnicą że właśnie strony z katalogu będą miały poźniej całkowitą indeksacje, a strony poza katalogiem tylko zaindeksowaną domenę główną.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności