Skocz do zawartości

Hurtowe sprawdzanie duplikatów treści


przemeks

Rekomendowane odpowiedzi

Hej,

czy spotkał się ktoś z was z gotowym narzędziem, które automatyzuje sprawdzanie występowanie duplikatów treści na innych serwisach? Chodzi mi o to, że chciałbym sprawdzić, czy konkretne treści już zostały powielone na innych serwisach. Działanie takiego narzędzia wyobrażałbym sobie tak:

1) Podaję listę cytatów charakterystycznych dla konkretnych artykułów

2) Definiuje moją domeną, która zostaje pominięta w procesie sprawdzania ew. występujących duplikatów

3) Skrypt to sprawdza, a następnie, jeśli występują wyniki wyszukiwania zawierające konkretną frazę, to raportuje, że w tym przypadku coś jest nie halo.

Wielkich cudów tu nie potrzeba, można by to nawet i samemu napisać, ale po co odkrywać Amerykę na nowa - a nóż widelec już ktoś coś takiego napisał :)

Odnośnik do komentarza
Udostępnij na innych stronach

wystarczy napisac prosty skrypt ktory: wysyla cytat do google w formacie "jakis text", jesli danego cytatu nie ma google zwraca

Nie no jasne, że można coś takiego napisać, ale coby nie siedzieć pół dnia (programowanie to nie moja domena) wolałem spytać czy czegoś takiego nie można gdzieś już dostać :) Tak jak witryny stawiam na WP, tak też wolę znaleźć gotowe rozwiązanie i do tego celu :)

Jest sprawdzone ale płatne narzędzie https://copyscape.com/ - robi dokładnie to co potrzebujesz.

Zacząłem się rejestrować, ale już na początku mam pewne obawy, bo Copyscape w propozycji sprawdzania plagiatów za każdym razem chce URL'e stron do sprawdzania pod kątem plagiatu, a treści, które chce chronić nie są publicznie dostępne, więc zależy mi na tym, aby podać cytaty z tych materiałów, bo URL'i podać nie mam jak :) Ktoś może sprawdzał Copyscape pod tym kontem - da się sprawdzać duplikaty na podstawie cytatów, a nie URL' pierwotnych treści?

Odnośnik do komentarza
Udostępnij na innych stronach

Jak by ktoś był zainteresowany to bardzo fajnie może zrobić sobie samemu darmową wersję Copyscape premium :) Wystarczy do tego prosty skrypt w php, który parsuje treść podstrony Copyscape odpowiedzialnej za analizę naszej treści. Takie coś zapętlamy i wrzucamy do Crona. Za każdym razem sprawdzamy czy na stronie występuje np. fraza "No results were found for this page." - jeśli ją znajduje to ok, jeśli nie to wysyłamy sobie maila z alertem :P

A jednak ######:

The maximum number of scans per month has been reached for this site.

For more, please sign up for a Premium account. More info...

Zostaje mi skanowanie za pomocą Google :)

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności