Skocz do zawartości

Google Update: Frazy Mocno Spamowane


kpt.nemo

Rekomendowane odpowiedzi

Żeby zakonczyć bajki o desynonimizacji.

Majestic pokazuje coś takiego: Pages crawled: 472,383,604,906 Unique URLs: 3,584,026,567,247 Date range: 07 Oct 2007 to 08 May 2013

Teraz podchwytliwe pytanie, ile trzeba wykonać porównań żeby stwierdzić, ile jest unikalnych (w sensie tresci) urli?

Pytanie pomocnicze, jak czasochlonna jest klauzula GROUP BY w sql?

Co do desynonimizacji, metoda przedstawiona przez Radka stanie w miejscu juz przy niewielkiej liczbie wrzuconych tekstow.

Dociekliwym proponuję wpisac w googla "tautologia", "big data" i podrazyc temat.

Na koniec wnioski:

O ile w obrebie jednej domeny google z pewnoscia jest w stanie stwierdzic DC, o tyle w przypadku calego internetu nie ma absolutnie zadnej opcji i tu nawet komputery kwantowe raczej nie pomoga, zeby oflagowac kazdy z urli.

Wydaje mi się, że specjalnie piszesz w ten sposób :( Zakładać, że Google działa jak mały Jasio ze swoim ułomnym umysłowo nauczycielem z podstawówki to trzeba mieć dużo tupetu! :)

Podstawowa zasada KAŻDEGO algorytmu bazodanowego to wykonywanie operacji w kolejności od najmniej kosztownej do najbardziej kosztownej, kosztownej w sensie mocy obliczeniowej oczywiście.

Przecież po to jest m. inn. disavow i system flagowania aby nie było potrzeby dokonywania takich ogromnych operacji bo to byłby czysty absurd!

Poczytajcie sobie w jaki sposób "przerabia" się spam na dużych serwerach pocztowych gdzie trzeba przefiltrować miliony maili na godzinę na wcale nie ogromnych systemach sprzętowych, oczywiście system antyspamowy nie jest ani szczelny ani precyzyjny - dokładnie to samo widać w serpach googla, raz filtry puszczają bardziej, raz są ustawione za mocno, czasem ktoś specjalnie coś podkręci i tak to działa metodą przybliżeń a użyszkodnicy sami pomagają dostarczając darmowych informacji i przy spamie mailowym i przy spamie w serpach i poprzez różne "darmowe" narzędzia od wujka G.

Więcej nie piszę bo i tak limit wyczerpałem na dzisiaj, ale nie traktujcie ludzi z Google jak idiotów bo to nie ma sensu, oni mogą być mocno spaczeni mentalnie, szczególnie ci od marketingu ale w swojej masie, ci decyzyjni to nie idioci, lepiej sobie zrobić takie założenie, to i wyniki potem będą lepsze :)

Tutaj będą zaj...iste trzy linki...

Odnośnik do komentarza
Udostępnij na innych stronach

  • Odpowiedzi 630
  • Dodano
  • Ostatniej odpowiedzi

[...]

Pytanie pomocnicze, jak czasochlonna jest klauzula GROUP BY w sql?

[...]

Tobie się może wydaje, że google indeksuje strony w tradycyjnej relacyjnej bazie danych która się odpytuje przez SQL? :D

Wyprowadzam Cię z ewentualnego błędu: działają na bazie typu NoSQL własnej produkcji, nie wiele o tej technologii wiadomo, ale coś wiadomo:

https://pl.wikipedia.org/wiki/BigTable

aha, a coś takiego jak "group by" nawet na trylionach stron to oni robią w ułamek sekundy używając dziesiątków tysięcy serwerów równocześnie.

Odnośnik do komentarza
Udostępnij na innych stronach

Widze temat zmarl smiecia naturalna :)

Podobno ten up to tylko przymiarka i maja byc dwa kolejne, konkretniejsze. Pomijajac to, ze spamerzy szybko wynajduja cos nowego (parasite) to musze przyznac, ze przy kilku drobnych poprawkach spam jaki znamy do tej pory moze w koncu oberwac. Inna kwestia to czy Google na prawde bedzie chcialo sie tego spamu pozbyc czy standardowo zagra pod publike, poczysci a za chwile stere rzeczy znow zaczna dzialac.

Odnośnik do komentarza
Udostępnij na innych stronach

Na dwoje babka wrozyla. Bajer polega na tym, ze jest kilka niezaleznych od siebie wektorow i kazdy ciagnie w innym kierunku. Polityka roznych dzialow Google nie zawsze jest spojna a strategia nie jest wszystkim powszechnie znana chociaz w tym wzgledzie sklanial bym sie raczej do sporego zamieszania, mega czystek, koniec spamu i gora 2-3 miesiace powrot do spamu, moze w nieco zmienionej formie ale przy tych samych zalozeniach.

Moze sie okazac, ze cos trzeba bedzie kombinwoac ze starymi domenami, moze przykladac 301 na mocne domeny i zdejmowac, moze hodowac domene przez pare miechow zanim sie ja pospamuje ale suma sumarum wrocimy do punktu wyjscia jak tylko wypracuje sie nowa metoda.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności