Skocz do zawartości

Google Update: Frazy Mocno Spamowane


kpt.nemo

Rekomendowane odpowiedzi

  • Odpowiedzi 630
  • Dodano
  • Ostatniej odpowiedzi

W DE są frazy, które wcześniej obstawione były przez stronki ostro linkowane. W ostatnich dniach wycięło wszystko. W top10 są 10 letnie domeny z 40 linkami. Nie jest to branża porno, kredyty itd. Obawiam się, że zmiany widziane na paydayach mogą zostać wprowadzone globalnie.

W Polsce tez wycielo i wycina non stop, ale czy to mechanizmy ultrasupernowoczesne cy po prostu pingwin non stop grasuje i kazda strone po kolei analizuje.

Odnośnik do komentarza
Udostępnij na innych stronach

Witajcie,

zgodnie z tym co pisałem desynonimizator wysawiony na stronie, zapraszam do testów:

https://radek.kubera.org/SEO/Desynonimizator+-+SPAM+Stop+po+raz+drugi.html

@Beer - zgodnie z zasadą że 50% podobieństwo to już prawie pewna synonimizacja - Twój wcześniejszy przykład by co najmniej trafił na stację raejtera.

Pozdrawiam.

logosc.png

Nowa odsłona systemu!!! --- Radek Kubera na G+.--- Mój blog: radek.kubera.org

Odnośnik do komentarza
Udostępnij na innych stronach

- Najlepsze teksty Skippera vhjs.jpg

"Zostawmy tego szaleńca z jego szaleństwem".

Oczywiście chodzi o teorie a nie o osobiste cechu charakteru Radka żeby było jasne, może w życiu prywatnym nie jest aż tak zakręcony, nie wiem i nie jest to wycieczka osobista.

Mi się już komentować nie chce tego co Radek pisze.... idę dalej wysłać synonimizowane teksty z generatora żeby Google ich od razu wyłapało, oflagowało, pomalowało na czerwono, a wy dyskutujcie z Radkiem dalej może kolejnym po desynonimizatorze bedzie diabolizator na przykład, który pokazuje czy link jest dobry czy zły.

Odnośnik do komentarza
Udostępnij na innych stronach

Szczerze to nie wierzę w skuteczność tego mechanizmu. Być może źle zrozumiałem, ale jeżeli mechanizm ten miałby obsługiwać wszystkie/większość języków to wymagałoby zaangażowania armii lingwistów, programistów i generalnie to byłby kolosalny projekt. Po Google Translate widać, że te mechanizmy u Google jeszcze słabo działają, ale załóżmy, że to problem z tłumaczeniem, a nie ze sprowadzeniem języka do jakiejś meta-wersji.

Zakładając, że ogromna armia ludzi przygotowała taki system, przy błogosławieństwu i finansowaniu Google... pytanie skąd Ty to masz? :) Wyobrażam sobie, że wymagałoby to sporej bazy i mocy obliczeniowych, a widzę, że działa na Twoim hostingu.... Coś mi się to wydaje grubymi nićmi szyte. No, ale OK. Nie oceniam, nie wiem wszystkiego - życie nie raz mnie zaskoczyło i może tak będzie w tym przypadku.

Pobawiłem się chwilę tym skryptem, rewelacji nie ma, ale zastanawia mnie taka sprawa. Wziąłem tekst z Twojej strony:

Chcę, aby branża SEO zrozumiała, że synonimizacja (przynajmniej na aktualnym poziomie) już jest historią. Mój program ma 230 linii kodu - Google ma więcej czasu i ludzi na napisanie "porządnego" programu i dużą próbkę do testów. Oczywiście przejdą wielopoziomowe teksty bardzo mocno posynonimizowane - jednak taki automat wyłapie moim zdaniem już dziś przynajmniej 30% spamu z automatu. Dodatkowo głęboka synonimizacja znów podniesie koszty SEO - a przecież o to chodzi.

rozbiłem na dwa:

1.

Chcę, aby branża SEO zrozumiała, że synonimizacja (przynajmniej na aktualnym poziomie) już jest historią. Mój program ma 230 linii kodu - Google ma więcej czasu i ludzi na napisanie "porządnego" programu i dużą próbkę do testów.

2.

Oczywiście przejdą wielopoziomowe teksty bardzo mocno posynonimizowane - jednak taki automat wyłapie moim zdaniem już dziś przynajmniej 30% spamu z automatu. Dodatkowo głęboka synonimizacja znów podniesie koszty SEO - a przecież o to chodzi.

I otrzymałem wynik:

Podobieństwo tekstu 1 do 2: 5.7142857142857%

Podobieństwo tekstu 2 do 1: 6.25%

Rozumiem znikome podobieństwo, ale nie rozumiem skąd różnica pomiędzy tymi liczbami. Mam wrażenie, że algorytm, skoro sprowadza tekst do jakiejś meta-postaci, powinien dać dwa identyczne rezultaty.

Kompletnie abstrahuję od kwestii upubliczniania takiego mechanizmu. Gdyby Google nim operowało, a Ty w jakiś sposób miałbyś do niego dostęp do wyobrażam sobie wiele powodów, aby publicznie o nim nie mówić: od mega lojalek w Google zaczynając, na zwykłej tajemnicy handlowej (własnej) kończąc.

Reasumując, nie oceniam, ale jestem mocno sceptyczny.

Odnośnik do komentarza
Udostępnij na innych stronach

...może w życiu prywatnym nie jest aż tak zakręcony, nie wiem i nie jest to wycieczka osobista...

No, spasiba, balszoj spasiba dla Ciebia!

edyta @Analityk, ale weź jeden tekst, poddaj go zwykłej synomizacji i wtedy porównaj obie wersje po wypluciu np z seoleniwca

Różnice w procentach będą bo obie wersje są poddawane desynomizacji, a tu może w zależności od wylosowanych wczesniej synonimów pojawić sie rozbieżność w sprowadzonych tekstach do wersji podstawowej, którą dopiero sie analizuje.

- Reklama -

Podatki we Wrocławiu: biuro podatkowe wrocław

Miejscówa do parkowania przy Okęciu: parking okęcie

Odnośnik do komentarza
Udostępnij na innych stronach

@Analityk - nie mam żadnych konszachtów z Google :D Poza serpami ;)

Różnica w wynikach pochodzi między innymi z różnej długości tekstów (ale nie tylko) - mechanizm poszukuje części wspólnych i wylicza podobieństwo na podstawie części wspólnej/ do wszystkich wyrazów w danym tekście.

Jeżeli teksty mają różną długość - wskaźniki będą się różnić.

Co do lingwistów - nie ma takiej potrzeby. Ja wykorzystałem słowniki Open Office (tu język polski). Gdybym zassał też inne języki - miałbym desynonimizator też dla innych języków - lingwiści są zbędni, ta praca już została wykonana i to na poziomie open source.

To narzędzie np. samo potrafi określić język na podstawie słownika ;)

Przyjdzie moment to dołożę do desynonimizera opcję detekcji języka (na zasadzie - to nie jest język polski). Już to w zasadzie mam, ale nie pokazuję tej informacji.

Pozdrawiam.

logosc.png

Nowa odsłona systemu!!! --- Radek Kubera na G+.--- Mój blog: radek.kubera.org

Odnośnik do komentarza
Udostępnij na innych stronach

^^ zawsze znajdzie się tekst, który obali teorię.

Jeżeli na stronie nawet taki 1 na 100 tekstów zostanie zakwalifikowany błędnie to i tak strona nie oberwie - ma za małą ilość dubli. Natomiast w katalogu/preclu/synonimizowanym zapleczu będziesz miał 70-80% dubli.

Pomijam, że tak, jak napisałem mechanizm jest strasznie kaleki - Google ma matematyków i grupy koderów co zrobią to 100% lepiej niż ja w domu.

Radek wszystko fajnie ale co jesli tekst zbudowany jest np. ze 100 kawalkow innych tekstow ?

Przeżyje ;)

logosc.png

Nowa odsłona systemu!!! --- Radek Kubera na G+.--- Mój blog: radek.kubera.org

Odnośnik do komentarza
Udostępnij na innych stronach

U mnie synonimy generują się z około 10 000 fragmentów tekstu, które są posynonimizowane na calkiem dobrym poziomie. wg twojego softu 9-17 % podobieństwa. Po 15% miały teksty z tej samej tematyki pobrane z 2 rożnych serwisów.

Przy użyciu tego bardziej dostaną synonimy pisane ręcznie przez ludzi, które to są bardziej logiczne niż automaty.

Dla mnie moga wprowadać nawet wczoraj ;]

O_o

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności