Skocz do zawartości

Find Duplicate - post wg. content


mojeprogramy.com

Rekomendowane odpowiedzi

ja to obecnie radze sobie tak:

1 wyciagam linki do podstron

2 wycinam szablon aby jak najnniej danych miał np. tylko <expect()> i id wpisu

3 scrapeboxem wyciagam expect + linki do podstron

4 wrzucam w Excela - filtrowanie  i usuwam duplikaty wg tresci

5 w scrapeboxie porównuje listy usunietych duplikatów linków vs orginalne

6 usuwam w bazie wpisy duplikujace

 

mam nadzieje że zrozumiałe ;)

 InternetSpeedTest.pl - speed test ookla, orange, upc, t-mobile, vectra | directX.pl - directx 9, 10, 11, 12 | kodex.pl

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności