初めてのPerl 第6版メモ。
7.2 単純なパターンを使う
- パターンを//で囲って指定すると、$_に対するマッチとなる。
- パターン中では全ての逆スラッシュエスケープを利用できる。
7.2.1 Unicode属性
7.2.3 単純な量指定子
- *:直前のものに0回以上マッチする。
- +:直前のものに1回以上マッチする。
- ?:直前のものが0回か1回マッチする。
7.2.4 パターンをグループにまとめる
7.2.5 選択肢
- |:|を挟んで左側か右側のいずれか一方の文字列にマッチする。
- a or b|a and b:a or bかa and bにマッチ。
7.3 文字クラス
- character class:[]の間に文字を並べたもの。いずれか1文字にマッチする。マッチは1文字だけ。
- ハイフンを使って範囲を指定できる。
- [a-zA-Z]:アルファベット
- [\000-\177]:7ビットASCII文字全て。
- [0-9]:数字
- 文字クラスの内側ではハイフンはエスケープが必要。
- ^は否定を表す。
- [^a]:a以外の1文字。
7.3.1 文字クラスのショートカット
- \d:すべての数字を表す。ASCIIの0から9まで以外の全ての言語での数字に対応する。
- \s:全ての空白文字。\p{Space}と概ね同じ。
- \h:水平方向空白文字(Perl5.10)
- \v:垂直方向の空白文字(Perl5.10)
- \R:行末(linebreak、Perl5.10)
- \w:ワードにマッチ。
- マッチ演算子の後ろに/a修飾子をつけるとASCIIコードのみの指定となる。
- /[\d]+/a
7.3.2 ショートカットの否定
- ショートカットのアルファベットを大文字にすると否定となる。
- [\d\D]:改行文字も含めた全ての文字にマッチする。