Skocz do zawartości

[PHP] skrypt do pobieranie contentu


uzytkowicz

Rekomendowane odpowiedzi

Macie może skrypt, który pobiera content z podanej strony www. ? Tzn wypluwa same teksty jakie są na stronie? Probówałem strip_tags ale wypluwa dużo śmieci, w tym java script.

Albo znacie może jakieś skrypty pod reklamy co generują/kradną treść? To pobiorę i zobaczę jak tam to rozwiązali :)

Odnośnik do komentarza
Udostępnij na innych stronach

@ Probówałem strip_tags ale wypluwa dużo śmieci, w tym java script.

Dlatego trzeba stosować dodatkowe filtry danych przy parsowaniu stron

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

function strip_tags_content($text, $tags = '<script></script>', $invert = TRUE) {

 preg_match_all('/<(.+?)[\s]*\/?[\s]*>/si', trim($tags), $tags);
 $tags = array_unique($tags[1]);

 if(is_array($tags) AND count($tags)> 0) {
if($invert == FALSE) {
  return preg_replace('@<(?!(?:'. implode('|', $tags) .')\b)(\w+)\b.*?>.*?</\1>@si', '', $text);
}
else {
  return preg_replace('@<('. implode('|', $tags) .')\b.*?>.*?</\1>@si', '', $text);
}
}
 elseif($invert == FALSE) {
return preg_replace('@<(\w+)\b.*?>.*?</\1>@si', '', $text);
}
 return $text;

}

Odnośnik do komentarza
Udostępnij na innych stronach

Macie może skrypt, który pobiera content z podanej strony www. ? Tzn wypluwa same teksty jakie są na stronie?

Wyłącz w przeglądarce JS,, grafikę i flash i będzie. Praktycznie wszystkie przeglądarki mają taką opcję.

Probówałem strip_tags ale wypluwa dużo śmieci, w tym java script.

Albo znacie może jakieś skrypty pod reklamy co generują/kradną treść?

Załatw z właścicielem tekstu zgodę na przedruk, to możliwe, że sam ci wyśle i będziesz mógł w tedy nie tylko pobrać, ale też coś z tym zrobić.

Darmowe programy
Potrzebujesz tekstów w krótkim czasie? Sprawdź tutaj.

Odnośnik do komentarza
Udostępnij na innych stronach

Istnieje skrypt który pobiera z innych stron treści (można określić tematykę), zamienia słowa na synonimy i tworze na ich podstawi proste zapleczówki.Poszukaj musi to być opisane gdzieś w necie. Nie korzystałem ale na oczy wiedziałem chyba rok temu.Nic więcej nie pamiętam

Odnośnik do komentarza
Udostępnij na innych stronach

Na pobranie treści danej strony jest kilka sposobów, ja napiszę Ci dwa.

Pierwszy. file_get_contents()

Jest to funkcja, która ma za zadanie właśnie pobrać treść danej strony internetowej.

https://pl2.php.net/manual/pl/function.file-get-contents.php

Jest prostsza do zastosowania od drugiej metody, ale bardziej zawodna.

Drugi. CURL

Jest to biblioteka, przy pomocy której możesz połączyć się z daną stroną, pobrać jej treść, wypełnić formularze, zapisać cookies, czy co tam sobie wymyślisz ;)

Zdecydowanie tę opcję bardziej polecam.

https://pl2.php.net/manual/pl/book.curl.php

tu masz ładnie opisane krok po kroku: https://www.entuzjasta.com/podstawy-curla-w-php/

a tutaj(po angielsku) możesz sobie poczytać forum z opisanymi wieloma rozwiązaniami najczęściej występujących problemów https://curl.haxx.se/

Gdy pobierzesz już stronę, wystarczy użyć wyrażeń regularnych, by odczytać tę część, która Cię interesuje.

https://www.antylameriada.net/wphppreg/

Ponad 300 e-booków po polsku i ponad 2000 e-booków po angielsku - e-booki za darmo

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności