romek_rozen

Forumowicze

Pokaż profil Zobacz aktywność

Postów
38
Dołączył
13 Września 2014
Ostatnia wizyta
4 Maja 2022

Odpowiedzi społeczności

romek_rozen odpowiedź w Jak wyodrębnić wiele adresów url ze strony www został oznaczony jako odpowiedź 26 Kwietnia 2022

W tej formule masz błąd. Masz wstawiony nawias przed // trzeba go usunąć.
Ogólnie ta formuła wyciągnie Ci pierwszy link, który w href ma domena.pl.

Poczytaj więcej o XPATH, może Ci to uprości dalsze prace. Ogólnie xPath wykorzystasz też potem np. w Screaming Frogu.
Jeżeli chcesz przeglądać strony kategorii to potrzebujesz jakiegoś crawlera albo programu, który kliknie na kolejną stronę na stronach kategorii postów.

Żeby wyciągnąć URL możesz kombinować w postaci:
Pobrania wszystkich URL postów i wyciągnięcia nazwy kategorii po xpath (moim zdaniem bez sensu) Jeżeli CMS ma bazę danych to przy pomocy mysql wyciągniesz sobie wszystkie posty danej kategorii i ich adresy też, wyciągniesz też w ten sposób opisy kategorii. Zrób crawl przy pomocy Screaming Frog i korzystając z opcji Extraction wyciągnij to co potrzebujesz ze stron kategorii. W Screaming Frog (SC) możesz definiować typy stron i zapytania xpath. Zapytania xpath możesz sprawdzić w google sheets albo w jakimś programie po wyguglaniu "xpath test" Jeżeli chcesz pobrać długość opisu kategorii to znowu z wykorzystaniem xpath znajdujesz tekst kategorii i sprawdzasz jego długość.
Możesz też podać wszystkim zebranym tutaj URL i na pewno ktoś Ci pomoże.
Może napisz do ludzi Artefaktu. Bo z tego co widzę to wszystko opierasz na ich webinarze, na którym mogły być błędy (na podstawie tego co mówisz).

Zaloguj się

romek_rozen

Postów

Dołączył

Ostatnia wizyta

Odpowiedzi społeczności

Przeglądaj

Cała aktywność

Twoje kanały aktywności

Powiadomienie o plikach cookie