Skocz do zawartości

romek_rozen

Forumowicze
  • Postów

    38
  • Dołączył

  • Ostatnia wizyta

Odpowiedzi społeczności

  1. romek_rozen odpowiedź w Jak wyodrębnić wiele adresów url ze strony www został oznaczony jako odpowiedź   
    W tej formule masz błąd. Masz wstawiony nawias przed // trzeba go usunąć.
    Ogólnie ta formuła wyciągnie Ci pierwszy link, który w href ma domena.pl.
     
    Poczytaj więcej o XPATH, może Ci to uprości dalsze prace. Ogólnie xPath wykorzystasz też potem np. w Screaming Frogu.
    Jeżeli chcesz przeglądać strony kategorii to potrzebujesz jakiegoś crawlera albo programu, który kliknie na kolejną stronę na stronach kategorii postów.
     
    Żeby wyciągnąć URL możesz kombinować w postaci:
    Pobrania wszystkich URL postów i wyciągnięcia nazwy kategorii po xpath (moim zdaniem bez sensu) Jeżeli CMS ma bazę danych to przy pomocy mysql wyciągniesz sobie wszystkie posty danej kategorii i ich adresy też, wyciągniesz też w ten sposób opisy kategorii. Zrób crawl przy pomocy Screaming Frog i korzystając z opcji Extraction wyciągnij to co potrzebujesz ze stron kategorii. W Screaming Frog (SC) możesz definiować typy stron i zapytania xpath. Zapytania xpath możesz sprawdzić w google sheets albo w jakimś programie po wyguglaniu "xpath test" Jeżeli chcesz pobrać długość opisu kategorii to znowu z wykorzystaniem xpath znajdujesz tekst kategorii i sprawdzasz jego długość.
    Możesz też podać wszystkim zebranym tutaj URL i na pewno ktoś Ci pomoże.
    Może napisz do ludzi Artefaktu. Bo z tego co widzę to wszystko opierasz na ich webinarze, na którym mogły być błędy (na podstawie tego co mówisz).
     
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności