Skocz do zawartości

[JAK] Masowe pobieranie URL'i z określonego DIV'a


Darq

Rekomendowane odpowiedzi

Witam. Zadanie jest następujące. W kodzie strony znajduje się pewien określony DIV, który wygląda tak:

<div class="nazwa-diva"><span>Zobacz TO:</span> <a href="https://www.przykladowadomena.pl"><b>Dowolny anchor</b></a></div>

Celem jest pobranie URL'a z tego DIVa lub ewentualnie pobranie całego DIVa żeby można było sobie później z tekstu powyciągać URL'e.

Takich witryn jest kilka tysięcy i w każdej z nich ten DIV ma tę samą nazwę.

W jaki sposób zrobić to jak najprościej?

Odnośnik do komentarza
Udostępnij na innych stronach

Moge Ci to napisac.

https://www.forum.optymalizacja.com/topic/162110-wykonam-nietypowa-usluge-%3B/#entry1117680

20 - 30 zl jezeli schemat bedzie prosty.

GG: 8186178

A jezeli chcesz to zrobic sam to cURL + preg_match

Niektórzy mówią, że dobry programista django jest na wagę złota. Zapraszam Cię na mój blog prawiący o informatyce.
Najlepsze suchary w sieci.

Odnośnik do komentarza
Udostępnij na innych stronach

Mogę polecić Ci język programowania PHP

1. Tablica z urlami do stron

2. Pętla

2.1. file_get_contents /ewentualnie cURL, fopen

2.2. preg_match_all

2.3. dorzucanie url do tablicy

A dokładniej to jest 4-5 linijek kodu.

Pozdrawiam

a9177b36246d7ce96fa698c9971dd36b.png

Sprzęt akwarystyczny kupuj w moim - sklep akwarystyczny.

adwokat częstochowa - Radca prawny Grzegorz Ledwoń. Pomoc w sprawie odszkodowania.

Odnośnik do komentarza
Udostępnij na innych stronach

Odnośnik do komentarza
Udostępnij na innych stronach

Zainteresuj się dodatkiem do Chrome XPath Scraper

Przydatna komenda do wyciągania takich linków to:

//div/a/@href - oczywiście do rozbudowania w przypadku określonych stron i ich struktury (...z googla przez site: możesz wyciągnąć linki przy pomocy - //div/div/ol/li/div/h3[@class=r]/a/@href ...)

Odnośnik do komentarza
Udostępnij na innych stronach

$adresy=file('adresy.txt');
foreach($adresy as $adres)
{
preg_match('/<div class="nazwa-diva"><span>Zobacz TO:<\/span> <a href="([^"]*)"><b>Dowolny anchor<\/b><\/a><\/div>/is',file_get_contents(rtrim($adres)),$wynik);
echo $wynik[1];
}

jakoś tak, nie sprawdzałem

E: muszę z Mionem ustalić ile mogę linijek kodu publikować za darmo, bo mu w biznes wchodzę :P

nihil fit sine causa

Odnośnik do komentarza
Udostępnij na innych stronach

@E: muszę z Mionem ustalić ile mogę linijek kodu publikować za darmo, bo mu w biznes wchodzę

Ha,ha mnie takie zlecenia - pierdoły nie interesują.

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

Wyrażenia regularne są o wiele bardziej zasobożerne. Przy takich rzeczach tj. do wyciągania danych ze stron stosuje się powszechnie xpath i taką też opcję Tobie proponuję. W XScraper lub Scraper for Chrome bez większego problemu wyciągniesz sobie co tylko chcesz.

Domeny na sprzedaż - pod zaplecze SEO, strony PP, strony firmowe, sklepy internetowe.

Zapraszam również na podstronę z darmowymi narzędziami SEO >> https://techformator.pl/darmowe-narzedzia-seo/

Jeżeli jesteś zainteresowany publikacjami wpisów gościnnych, napisz do mnie @.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności