Skocz do zawartości

RSS a duplicate content


graff

Rekomendowane odpowiedzi

RSS z samej definicji jest źródłem duplikatów. Stroniczki w polskim necie, stanowiące toporne hurtownie rss z zerowym contentem własnym, mają sie jeszcze nieźle. O ile wiem, w połowie wrzesnia nastąpiła modyfikacja filtra G na duplikaty.

Pomijając sytuację bezpieczną, czyli taką, gdzie content rss stanowi np. 20% objetości strony - czy w czasie ostatniego update algo spadki Waszych stron mogły byc z tym związane ? Ktoś dostrzegł jakieś zależności przyczynowo-skutkowe ?

Interesuje mnie taka sprawa: szykuje się wersja AdSense dla rss. To spowoduje ogromną podaż newsów rss. Wobec owczego pędu do generowania z automatu setek "serwisów", byle podpiąć pod to własne AS - sieć zacznie pękać w szwach od multiplikowanych treści. To spowoduje (bo chyba musi) kolejne zaostrzenie rygorów filtra....

Pytanie brzmi: jak korzystać z RSS by zagwarantować sobie święty spokój na dłuższy czas ?

Odnośnik do komentarza
Udostępnij na innych stronach

Pytanie brzmi: jak korzystać z RSS by zagwarantować sobie święty spokój na dłuższy czas ?

Sam sobie nieco odpowiem, bo temat jest na czasie. Również w kontekście praw autorskich, znaków towarowych, itd... oczywiście szczylom i zawodowym spamerom to zwisa, ale dla tych, którzy ze swoimi stronami wiążą jakieś plany może być istotne:

Za searchenginewatch:

"Friendly" sites are no less liable than unfriendly sites. "Attribution to the original content source has no impact on potential liability," said Naeger. "If this were copyright infringement, then the attribution would be irrelevant." Before reproducing an author's material, make sure you have permission to reproduce it from the person (or company) who owns the copyright.

RSS feed content is no exception. "People use my RSS feeds to pull in the full content to their own pages for their own AdSense [revenue]," explained Jennifer Slegg of JenSense.com, who is experienced with enforcing legal copyrights. "I run AdSense up on my own site. So my AdSense is up on their sites with their AdSense ads, which puts me in violation of AdSense terms. These are people that want freebie content and try to get away with stealing it."

"You can set up an RSS feed that only puts out summarized content. But we don't have resolution yet on what are those rights—are they broad or are they individual?" said Goldman. "There are those who will say that by having your content posted in an RSS feed, you are giving others the right to go and grab that content for their own sites."

Odnośnik do komentarza
Udostępnij na innych stronach

Tak, zgadzam sie, że problem z duplikatami tworzonymi za pomocą pobieranego kanału RSS jest coraz bardziej męczący.

Na jednym z for mam ok. 350 subskrybentów kanału RSS. Niestety cała masa spamerów ciągnie z tego kanału materiał do "serwisów" stanowiących "czytniki online" z całą masą reklam AdSense.

Jak z tym walczyć?

Nie opierałbym się na przepisach prawa. Osobiście zacznę wkrótce wyłapywanie duplikowanych treści w necie (na szczęście dzięki G jest to łatwe) i zacznę blokować "dystrybutorów treści" po IP. To chyba najszybsza i najskuteczniejsza metoda.

Druga sprawa, to to, jak Google rozpoznaje, co jest oryginałem, a co duplikatem (kryterium pierwszeństwa w czasie, kryterium "ważności" strony (PR?).

Niezmiernie ważne będzie zapewne zapewnienie jeszcze szybszego indeksowania nowych treści (dobre konwencjonalne mapy strony, wykorzystywanie Google Sitemap, czasowe wstawianie linków do nowych treści na stronie głównej serwisu - do momentu zaindeksowania, itp.).

Odnośnik do komentarza
Udostępnij na innych stronach

Graff, coś jest na rzeczy z tym filtrem o którym wspominasz, czy jest spoósb żeby się przed tym ustrzec? przykład Cuttsa i jego bloga pokazuje że jedyny sposób to całkowite blokowanie RSS

Canon sony aparaty cyfrowe, kamery cyfrowe - promocja. Atrakcyjny system ratalny. Katalog stron www

Odnośnik do komentarza
Udostępnij na innych stronach

Jak z tym walczyć?

No własnie, jest kłopot, który powoli dociera do wydawców RSS. Chodzi o sprzeczność pomiędzy ideą udostępniania nagłówków, a sposobem ich wykorzystania i np. polityką G w stosunku do duplikatów.

Istnieje całkiem realne zagrożenie, że w pierwszej kolejności zaindeksowana zostanie kopia, a nie oryginał, więc kryterium czasu chyba w rachubę nie wchodzi. Z drugiej strony - różnica w objętości nagłówka i oryginału jest z zasady znaczna, więc ryzyko kwalifikacji oryginału jako duplikatu kopii jest niewielkie. Itd, itd... tak czy inaczej - temat jest dyskusyjny i - jak zwykle - rozstrzygnięcia leżą po stronie G. Z oczywistych przyczyn, muszą to załatwić na cito, bo poważni gracze zaczynają sie irytować.

Sposób polegający na ograniczeniu dostępu wyłącznie dla rzeczywistych "subskrybentów" jest chyba jedynym na dzisiaj, który spełnia zasady bezpieczeństwa, ale ogranicza efektywność rss jako narzędzia seo i marketingowego. Ci, którzy poza nagłówkami udostępniają pełne teksty (a znam dwa niezłe serwisy jednego z forumowiczów, budujące content w oparciu o taki materiał), chyba się z tego będą wycofywać - powolutku, ale sukcesywnie.

Pneuma, ponieważ drugi raz zdarzyło się, że szlag trafił moje zasoby na home z wyprzedzeniem w stosunku do globalnego kataklizmu, uznałem, że to nie może być przypadek i byłem tak upierdliwy w stosunku do G, że uzyskałem potwierdzenie dwóch rzeczy:

1. mam wątpliwą przyjemność (tzn mój adres) należeć do puli testowej (istnieje)

2. filtr na kopie jest zmodyfikowany (pytałem w kontekście rss).

Ad. 2 żadnych detali oczywiście, ale może zabawa w filter=0, pozwoli zainteresowanycm na określenie zakresu zmian. RSS to tylko automat do "robienia cytatów", więc fragmenty bloga MC znajdziesz w sieci w tysiącach kopii. Jak zamierzają - porządkując sprawę rss - pozamiatać kwestię "recznie robionych" cytatów (wobec zaostrzenia polityki anty-duplikatowej), pojęcia nie mam. Pewnie - jak to mają w zwyczaju - wyleją dziecko z kąpielą.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności