K2. PCRE正規表現の特性 |
正規表現は対象の文字列に対して左から右へマッチするパターンです。ほとんどの文字はパターン内ではその文字自身を意味し、対象内の対応する文字にマッチします。 正規表現の強みは、パターン内に代入と繰り返しを含むことが出来るという点にあります。それらは、それ自身を意味せずに特殊な解釈をされるメタ文字の使用によって、パターン内にエンコードされます。 メタ文字には2種類あります。角括弧内を除くパターン内のどこでも使用できるものと、角括弧内でのみ使用できるものです。角括弧の外でのメタ文字は以下の通りです。
角括弧内のパターンの一部は「文字クラス」と呼ばれます。文字クラスの中でメタ文字として扱われるのは以下のものだけです。 \ 一般的なエスケープ文字 ^ 先頭にある場合のみ、後に続く文字クラスを否定 - 文字の範囲を指定 [ POSIX文字クラス(POSIXシンタックスが後に続いた場合のみ) ] 文字クラスの終了 |