top bar

글 목록

2014년 7월 5일 토요일

정규식 - 기본 패턴 찾기 (1)

1. 문자열 상수 찾기 그냥문자열

문자열 상수를 사용하면 해당 문자열을 찾을수있다. 예를들어 'Korea' 라고 입력하면 
텍스트파일에서 'Korea'를 찾아내는 것이다. 뭐, 딱히 설명이 필요없다.

2. 단축 문자 모음 

단축문자
설명
\a
벨 문자
[\b]
백 스페이스 문자
\c x
제어 문자
\d
숫자
\D
숫자가 아닌 문자
\d xxx
문자의 10진수 값
\f
폼 피드 문자
\h
수평 공백
\H
수평 공백이 아닌 문자
\r
캐리지 리턴
\n
개행문자
\0xxx
문자의 8진수 값
\s
공백 문자
\S
공백이 아닌문자
\t
수평 탭 문자
\v
수직탭 문자
\V
수직탭이 아닌문자
\w
영문자숫자, _, 기타 스크립트 문자
\W
영문자숫자, _, 기타 스크립트 문자를 제외한 문자
\0
널 문자
\x xxx
문자의 16진수 값
\u xxxx
문자의 유니코드 값


* 문자 클래스 안에 ' ^ ' 은 여집합의 개념이다. 예를 들어 [^0-9] 는 숫자가 아닌 문자를 찾아낸다.
\W 은 영문자와 숫자, _(언더바)를 제외한 공백, 구두점 같은 문자만 찾는다. 따라서 \W은 아래와 같다
  [^a-zA-Z0-9_]

* \s 은 공백을 찾는 정규식인데, 이것은 아래와 같은 의미이다

[ \t\n\r]

즉 위의 정규표현식은 다음과 같은 경우를 찾는다

- 공백
- 탭( \t)
- 개행 문자 (\n)
- 캐리지 리턴 (\r)

물론 반대짝도 있다 \S은 공백이 아닌 문자를 찾는다 물론 [^ \t\n\r] 과 의미가 같다.

댓글 없음:

댓글 쓰기