Skocz do zawartości

Penguin update w nadchodzacym tygodniu?


agtile

Rekomendowane odpowiedzi


Poleciał randomem jak rok temu

random owszem - nawet w obszarze witryny. Poleciały posty/frazy linkowane i nielinkowane. Część ocalała ( czyt. to nie jest zupełne dno - pracuj ciężko to moze coś z tego będzie , Twoja strona jest nam potrzebna do zapełniania wyników żeby bogaci czuli Twój oddech na plecach ). Poleciała nawet strona "zapomniana" i nie linkowana od stycznia. To co zostało to strony zapomniane żyjące własnym życiem ( heheh z wysokim PR - a jakże :P i tekstami z dooopy ). Na BHW czuć oddech śmierci ;)

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 461
  • Dodano
  • Ostatniej odpowiedzi

To już koniec update. Może być lekka czkawka ale update skończony.

Myślę że to jednak dopiero początek. Prawdopodobnie to co teraz mamy to tylko data refresh, a przed nami jeszcze update algorytmu.

Zresztą jak to ujął pewien nielubiany tu człowiek z Google, który jest jeszcze na urlopie:

expect that the next few Penguin updates will take longer, incorporate additional signals, and as a result will have more noticeable impact.
Odnośnik do komentarza
Udostępnij na innych stronach

@Backpaker - ten sam człowiek albo jakiś drugi kłamca od nich powiedział, że nowy pingwin to poprawki nad którymi pracowali rok. Wszyscy liczyli na cuda i uzdrowienie algorytmu, wręcz pisali, że się nie mogą doczekać a dostali ten sam szajs co rok temu :) Gwarantuję, że to już koniec. Ucierpiało ok 20 % losowych stron a wśród strony fanatyków: i love disavow, content is king, nie linkuję bo nie muszę - samo się trzyma.

Dla tych co lubią na biało i dla tych co na czarno:
logo_ap.jpg godmodelogo.jpg

Odnośnik do komentarza
Udostępnij na innych stronach

@intru

Nie będę polemizował bo nie mam 100% dowodów na moja tezę, tylko wyniki analiz circa 300 fraz, które obserwuję włącznie z korelacjami pomiędzy zmianą pozycji na rzeczone frazy a sposobami linkowania. Ale myślę że wrócimy, chcąc nie chcąc, do tego tematu za jakieś 2 tygodnie :)

Odnośnik do komentarza
Udostępnij na innych stronach

Dzisiaj już kompletnie nic się nie dzieje. Pierdyknęło wczoraj w nocy i już. Trochę to dziwne, bo każdy pingwin trwał po parę dni, teraz też tak zapowiadali. Może im prądu zabrakło :D

- Przypadek? Wszechświat nie może sobie pozwolić na taki luksus.

Odnośnik do komentarza
Udostępnij na innych stronach

Powiem tak - ostatnio mocno wkręciło mnie programowanie i prawie tylko tym sie teraz zajmuję. Myślałem nad stworzeniem własnej wyszukiwarki - tylko w celach sprawdzenia się. Pojawił się pierwszy problem: robimy cache strony, który zwiera (po usunięciu wszystkich tagów html) kilkadziesiąt / kilkaset linijek czystego tesktu (szukanie w nim jest dosyć zasobożernym zadaniem).

Jak zrobić tak, żeby spośród x miliardów takich plików tekstowych (kopii wszystkich podstron) wyświetić te, których użytkownicy szukają ? Jest tylko jedno rozwiązanie - każda fraza jest osobną wyszukiwarką! Wydaje się to dziwne ale już tłumaczę: jeden robot przeszukuje stronę i kwalifikuje do (zgromadzonych już w bazie) zapytań. Ok znalazłem - strona pasuje do: skup, skup aut, skup aut Warszawa, skupa aut Warszawa centrum.

Te frazy są obiektami a raczej kolekcjami obiektów - kopii stron, które są wynikami dla tych fraz. Strony są wrzucane do "worków" z tymi frazami i jak wpisujemy "skup aut Warszawa" przeszukujemy tak na prawdę tylko wśród zasobów stron pasujących do tych fraz. W innym wypadku przeszukanie słów kluczowych w treści x miliardów stron zajęłoby kilka godzin.

Idąc dalej - google ma te frazy posortowane na komercyjne i niekomercyjne. Kazdy zestaw fraz jest osobną wyszukiwarka, z osobnymi zasadami i osobnymi suwakami. Dlatego właśnie są frazy całkowicie zablokowane (payday loans, diet pills), są frazy zamrożone, są też frazy kompletnie ignorowane, gdzie rządzi spam. Są frazy, gdzie top 10 okupuje wikipedia albo yelp w USA.

Każdy update polega na przefiltrowaniu baz (kolekcji) stron określonymi parametrami, po kakończeniu operacji update jest "live", czyli kopia jest wypuszczana do użytku. Z tego też powodu nic co się dzieje jak szukamy nie dzieje się w czasie rzeczywistym, tak samo żaden update nie trwa na żywo. Mielą coś tygodniami i jak wymielą wypuszczają. Inaczej się po prostu nie da :) Do tego dochodzą czynniki pt. BL, anchory itp. Nie da się operować na pełnej bazie wszystkich zasobów (kopii stron).

Myślałem nad tym godzinami i nie wiedzę innego rozwiązania. Spróbujcie otworzyć plik txt zawierający 5 mln słów i poszukajcie jakiegoś konkretnego - teraz pomnóżcie to x 1000 dodajcie zamiast słów całe zestawy zdań, dodajcie czynniki BL i inne i będziecie już w 100% pewni, że tak się po prostu nie da :)

Dla tych co lubią na biało i dla tych co na czarno:
logo_ap.jpg godmodelogo.jpg

Odnośnik do komentarza
Udostępnij na innych stronach


Myślałem nad tym godzinami i nie wiedzę innego rozwiązania. Spróbujcie otworzyć plik txt zawierający 5 mln słów i poszukajcie jakiegoś konkretnego - teraz pomnóżcie to x 1000 dodajcie zamiast słów całe zestawy zdań, dodajcie czynniki BL i inne i będziecie już w 100% pewni, że tak się po prostu nie da

Ja tylko nie rozumiem dlaczego od razu zamierzasz przeskoczyć googla? to jest irracjonalne, wybierz sobie jedno słowo kluczowe na którym będzie twoja wyszukiwarka operować wtedy będziesz miał już całkowite rozeznanie pola działania.

Odnośnik do komentarza
Udostępnij na innych stronach

Nie nie, ja nie chę tworzyć komercyjnej wyszukiwarki :D Bardziej taki prywatny projekt do zabawy :) Długo myślałem jak to rozwiązać i nie ma innego wyjścia jak dzielić, bo wtedy wyszukiwanie wygląda tak:

skup aut Warszawa:

1. znajdź zbiór dla tej frazy
2. sortuj strony ze zbioru

I wyszukujemy w zbiorze ok 1k stron zawierających to słowo a nie miliardów stron.

Dla tych co lubią na biało i dla tych co na czarno:
logo_ap.jpg godmodelogo.jpg

Odnośnik do komentarza
Udostępnij na innych stronach

Nie nie, ja nie chę tworzyć komercyjnej wyszukiwarki :D Bardziej taki prywatny projekt do zabawy :) Długo myślałem jak to rozwiązać i nie ma innego wyjścia jak dzielić, bo wtedy wyszukiwanie wygląda tak:

skup aut Warszawa:

1. znajdź zbiór dla tej frazy

2. sortuj strony ze zbioru

I wyszukujemy w zbiorze ok 1k stron zawierających to słowo a nie miliardów stron.

ale sprawa jest bardziej udziwniona, bo hasło, które np. mnie interesuje zwraca teoretycznie 750.000 wyników, ale w google idąc na kolejne podstrony wyszukiwarka w sumie pokazuje ok. 350 wyników.

Ekologiczne torby papierowe z nadrukiem. Wysoka jakość! Chyba, że wolicie torby w Gdańsku ...
Siemianice to taka mała słoneczna miejscowość :)

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.


×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności