Sestavki iz regularnih izrazov

The regular expressions used in searches and segmentation rules are those supported by Java. Če potrebujete bolj konkretno informacijo, si prosimo oglejte http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html.

Enostavne primere lahko najdete na mreži (recimo http://www.regular-expressions.info/quickstart.htmle.)

Naslednji sestavek:

ustreza naslednjemu zaporedju:


Zastavice

(?i) Omogoči iskanje brez razlikovanja velikih ali malih črk (privzeto vzorec ločuje velike in male črke).

Znaki

x Znak x, razen v primeru...
\uhhhh Znak s heksadecimalno vrednostjo 0xhhhh
\t Tabulator ('\u0009')
\n Znak za novo vrstico - line feed -('\u000A')
\r Znak za povratek voza - carriage return - ('\u000D')

Citiranje

\ Nič, vendar citira naslednji znak. Potrebno, kadar želite enega od metaznakov !$()*+.<>?[\]^{|}navesti dobesedno.
\\ Na primer išče poševnico nazaj.
\Q Nič, citira pa vse znake do \E
\E Nič, vendar konča s citiranjem, ki se je začelo z \Q

Znakovni nizi

[abc] a, b, or c (enostavni razred)
[^abc] Katerikoli znak z izjemo a, b, or c (zanikanje)
[a-zA-Z] a do z ali A do Z, vključno (obseg)

Vnaprej definirani znakovni razredi

. Katerikoli znak (z izjemo konca vrstice)
\d Cifra: [0-9]
\D Ne-cifra: [^0-9]
\s Znak za beli presledek: [ \t\n\x0B\f\r]
\S Znaki, ki so beli presledek: [^\s]
\w Besedni znak: [a-zA-Z_0-9]
\W Nebesedni znak: [^\w]

Zadetki za meje

^ Začetek vrstice
$ Konec vrstice
\b Besedna meja
\B Nebesedna meja

Požrešni kvantifikatorji

Skušali bodo najti kolikor morejo. Na primer, a+ bo ustrezalo aaa v aaabbb
X? X, enkrat ali nikoli
X* X, nič- ali večkrat
X+ X, najmanj enkrat

Nezahtevni kvantifikatorji (ki niso požrešni)

Našli bodo tako malo, kot se le da. Na primer, a+? bo našel prvi a v aaabbb
X?? X, enkrat ali nikoli
X*? X, nič- ali večkrat
X+? X, najmanj enkrat

Logični operatorji

XY X, ki mu sledi Y
X|Y Ali X ali Y
(XY) XY kot ena sama skupina

Pravni poduk