Skocz do zawartości

Jak wyjąć wszelkie META z pliku html ?


Erbit

Rekomendowane odpowiedzi

A potrzebujesz wszystkie czy jakieś konkretne?

Jeżeli tylko kilka, typu keywords, description, title... to może pomogłoby ściągnięcie sobie qlweba i zobaczenie jak tam to rozwiązali.

Gdyby nie pomogło, to ja osobiście pobrałbym źródło strony, później podzielił na 2 części, gdzie separatorem byłoby wyrażenie </head>

Druga część do kosza, pierwsza do zapisania w postaci pliku tekstowego.

Plik tekstowy otwieram i albo jakieś większe wyrażenie regularne, albo wyszukuję w nim np wystąpienia słowa title i wyciągam wszystko co zawiera się pomiędzy tym słowem a znakiem >. Później pozostaje usunąć, lub zamienić na spacje każde wystąpienia cudzysłowów, znaków równości wyrażeń typu description i na koniec białych spacji.

Taką pętlę trzeba by kilka razy powtórzyć i na mój gust coś by z tego wyszło

pzdr

Jak nie znajdziesz wszystkich funkcji, daj znać, spróbuję wyszukać, robiłem coś podobnego, także raczej na pewno wszystkie istnieją.

Wiem, że to trochę pod górkę, wyrażenia regularne byłyby lepsze i mniej kodu, ale to tak na szybko wymyślałem, poza tym powinno zadziałać bez większego kombinowania

Odnośnik do komentarza
Udostępnij na innych stronach

preg_match('/<title>(.*?)<\/title>/is', $pageHTML, $result);

$title = $result[1];

:blush:

Ot konkret.. :D

Dziekuje

[edyta]

To sie też przyda, także gdzie indziej...

Kurcze.. warto być lamerem.. ;)

[edyta2]

oo... w tych wyrazeniach regularnych tez jest TITLE... :D

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności