[Python활용] 3. 문자열 다루기
문자열 출력형식
기본
- % 기호를 사용
- format() 함수를 사용
- format() 함수를 keyword를 이용하여 사용
정렬
- ’’: 50칸의 공백을 두고 왼쪽 정렬
- ’’: 50칸의 공백을 두고 오른쪽 정렬
- ’’: 50칸의 공백을 두고 가운데 정렬
숫자
- ‘{0:d}’: int형
- ‘{0:x}’: hex형
- ‘{0:o}’: oct형
- ‘{0:b}’: bin형
- ’’: 천 단위 , 출력
- ’’: 소수점 1자리의 % 사용
날짜
- ’’: 기본적인 날짜 형식
- %a: 축약된 요일의 이름(사용자의 시간 환경)
- %A: 축약되지 않은 요일의 이름(사용자 시간 환경)
- %b: 축약된 달의 이름(사용자의 시간 환경)
- %B: 축약되지 않은 달의 이름(사용자의 시간 환경)
- %c: 날짜와 시간(사용자의 시간 설정을 따름)
- %d: 한달 중의 특정 날짜를 숫자로 표시(1~31)
- %H: 24시간 제의 시간 표시(0~23)
- %I: 12시간 제의 시간 표시(0~12)
- %j: 1년중의 특정 날짜를 숫자로 표시(1~366)
- %m: 숫자로 표시된 월(1~12)
- %M: 숫자로 표시된 분(0~59)
- %p: AM/PM 표시
- %S: 숫자로 표시된 초(0~59)
- %U: 1년 중 주의 번호로 첫번째 일요일 부터 0으로 계산됨(0~53)
- %w: 숫자로 표시된 주(0~6/0이 일요일)
- %W: 1년 중 주의 번호로 첫번째 월요일 부터 0으로 계산됨(0~53)
- %x: 날짜 출력(사용자의 시간 설정을 따름)
- %X: 시간 출력(사용자의 시간 설정을 따름)
- %y: 세기가 없는 년도 표시(0~99)
- %Y: 세기를 포함한 년도 표시
- %Z: Time zone의 이름
- %%: %문자열 그 자체를 가짐
간단한 문자열 조작
대소문자
- upper(): 대문자로 변환
- lower(): 소문자로 변환
- capitalize(): 첫 단어의 첫 문자를 대문자로 변환
- title(): 각 단어의 첫 문자를 대문자로 변환
개수, 인덱스
- count(): 해당 문자의 포함 갯수
- index(): 해당 문자의 첫 포함 인덱스
문자열 속성
- isspace(): 공백으로만 이루어졌는지
- isalpha(): 알파벳으로만 이루어졌는지
- isalnum(): 알파벳과 숫자로 이루어졌는지
- isdigit(): 숫자모양으로만 이루어졌는지(제곱 가능)
- isdecimal(): int형으로 변환이 가능한지
- isnumeric(): 숫자값 표현으로 이루어졌는지(제곱근, 분수, 거듭제곱 가능)
문자열 다듬기
- lstrip(): 왼쪽 공백 제거
- rstrip(): 오른쪽 공백 제거
- strip(): 양쪽 공백 제거
문자열 분리
- split(): 문자열내의 특정 문자를 기준으로 분리
- splitlines(): 문자열을 newline 기준으로 분리
문자열 변경
- replace(): 문자열의 모든 특정 문자열을 특정 문자열로 변경
정규 표현식 사용
반복
- *: 0회 이상 반복
- +: 1회 이상 반복
- ?: 없거나 1번 사용
- {N}: N회 반복
- {M, N}: M회부터 N회까지 반복
특수문자
- I, IGNORECATE: 대, 소문자를 구별하지 않음
- L, LOCATE: \w, \W, \b, \B를 현재의 locale을 반영한
- M, MULTILINE: ^가 문자열의 맨 처음, $는 문자열의 맨 끝에 매칭
- S, DOTALL: “.”가 줄 바꿈 문자도 포함시켜 매칭
- U, UNICODE: \w, \W, \b, \B가 유니코드 특정에 의존하게 함
- X, VERBOSE: 정규직 안의 공백은 무시하게 함
- match(): 문자열의 처음과 찾을 문자열이 일치하면 True
- search(): 문자열 어디든 찾을 문자열이 일치하면 True
- findall(): 문자열을 모두 찾기
다양한 구분자 분리
- spiit(‘[,; ]+’, value): 문자열 중 ‘,’, ‘;’, ‘ ‘이 하나라도 포함될 경우 split
문자열 치환
- sub(): 문자열에서 매치된 텍스트를 다른 텍스트로 치환
문자열 매칭
- group(): 매칭된 문자열을 모두 반환