Skocz do zawartości

[REGEXP] Określona ilość znaków zakończona kropką.


verSuS

Rekomendowane odpowiedzi

Hej, mam tekst pisany ciurkiem - około 50k znaków.

Jakiego wyrażenia regularnego użyć żeby znaleźć w NP++ ciągi znaków minimum 400 znaków, zakończone kropką. Chodzi mi o pełne zdania, żebym mógł to zamienić na sztuczne paragrafy.

Z góry dzięki.

TANIE PUNKTY SWL - Automatyczna transakcja - punkty w 5 minut na Twoim koncie (seomatik, gotlink, statlink)

HURTOWE ILOŚCI: Linki z PageRank (ponad 1000 domen PR1-5)

Sławomir Siudek+

Odnośnik do komentarza
Udostępnij na innych stronach

HTTP 200 usługi IT -> Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL/ Laravel
Komory normobaryczne - normobaria.tech Wykonawca montażu i instalacji komory normobarii

Odnośnik do komentarza
Udostępnij na innych stronach

tu masz przynajmniej 400 znakow zakończone kropką

.{400,}\.

Nie jestem ekspertem od regexpów, ale w php to wygladaloby tak (te flagi Usi zawsze wykorzystuje ale nigdy nie sprawdzalem co oznaczaja :-P ):

preg_match('|(.{400,})\.|Usi',$tekst,$wynik)

pozycjonuj.png
Odnośnik do komentarza
Udostępnij na innych stronach

tu masz przynajmniej 400 znakow zakończone kropką

.{400,}\.

Nie jestem ekspertem od regexpów, ale w php to wygladaloby tak (te flagi Usi zawsze wykorzystuje ale nigdy nie sprawdzalem co oznaczaja :-P ):

preg_match('|(.{400,})\.|Usi',$tekst,$wynik)

No własnie sie zastawnawiam na co tam dajesz te U ...

\f znak wysunięcia arkusza.

\r znak powrotu karetki.

\n znak nowej linii.

\t tabulator horyzontalny.

\v matches vertical tab.

\0 znak NUL.

[\b] znak backspace.

\s odstęp (skrót dla [\f\n\r\t\v\u00A0\u2028\u2029]).

\S znak inny niż odstęp (skrót dla [^\f\n\r\t\v\u00A0\u2028\u2029]).

\w znka wyrazu (skrót dla [a-zA-Z0-9_]).

\W znak inny niż znak wyrazu (skrót dla [^a-zA-Z0-9_]).

\d liczba (skrót dla [0-9]).

\D znak inny niż liczba (skrót dla [^0-9]).

\b znak pozycji między wyrazami a dokładnie między spacją a wyrazem.

\B znak inny niż znak pozycji między wyrazami (skrót dla [^\b]).

\cX znak ctrl+X. Np: \cm oznacza control-M.

\xhh znak o kodzie hh zapisany w systemie hexadecymalnym.

\uhhhh znak Unicode o kodzie hhhh zapisany w systemie hexadecymalnym.

Odnośnik do komentarza
Udostępnij na innych stronach

<?php 
$txt = @file_get_contents('./tekst.txt');
$txt = str_replace("\r\n", "", $txt);
$txt = str_replace("\n", "", $txt);

$c = preg_match_all("/(.*?){400,}\./", $txt, $out);

if($c > 0) {
$par = '';

foreach($out[1] as $found) {
$par .= '<p>'.$found.'</p>';
}

echo $par;

}
?>

a-href.pl - moderowany, darmowy katalog stron - zapraszam do dodawania wpisów

Odnośnik do komentarza
Udostępnij na innych stronach

No własnie sie zastawnawiam na co tam dajesz te U ...

To |Usi to są parametry tych regexpów modyfikujace ich działanie a nie znaki specjalne(które zacytowałeś) zapisane np. \s czyli biały znak.

Edit: o tutaj znalazlem opis tego wszystkiego :)https://php.net/manual/en/reference.pcre.pa...n.modifiers.php

pozycjonuj.png
Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności