유니코드는 전 세계의 모든 문자를 나타내기 위한 표준 인코딩 체계입니다. 파이썬에서 문자열은 유니코드 문자를 조합하여 표현할 수 있습니다. 이번 포스트에서는 파이썬에서 문자열에 유니코드 문자를 조합하는 방법에 대해 알아보겠습니다.
1. 유니코드 문자 표현
파이썬에서 유니코드 문자는 \u
또는 \U
접두사를 사용하여 표현할 수 있습니다. \u
는 16진수로 4자리의 유니코드 문자를 표현하고, \U
는 16진수로 8자리의 유니코드 문자를 표현합니다.
예를 들어, 아래의 코드는 ‘안’이라는 한글 문자를 유니코드로 표현한 예시입니다.
ch = '\uC548'
print(ch) # 출력 결과: 안
2. 문자 결합
파이썬에서는 문자열에 유니코드 문자를 결합하는 방법을 제공합니다. +
연산자를 사용하여 문자열과 유니코드 문자를 결합할 수 있습니다.
아래의 코드는 ‘안’이라는 한글 문자와 ‘녕’이라는 한글 문자를 결합하여 ‘안녕’이라는 문자열을 생성하는 예시입니다.
ch1 = '\uC548'
ch2 = '\uB155'
msg = ch1 + ch2
print(msg) # 출력 결과: 안녕
3. 유니코드 문자 결합 함수
파이썬에서는 chr()
함수를 사용하여 유니코드 코드 포인트 값을 문자로 변환할 수 있습니다. 또한 ord()
함수를 사용하여 문자를 유니코드 코드 포인트 값으로 변환할 수도 있습니다.
아래의 코드는 chr()
함수를 사용하여 유니코드 코드 포인트 값으로부터 문자를 생성하는 예시입니다.
cp = 0xC548
ch = chr(cp)
print(ch) # 출력 결과: 안
4. 결론
파이썬에서 문자열에 유니코드 문자를 조합하는 방법에 대해 알아보았습니다. 유니코드는 다양한 언어의 문자를 표현하는 데 사용되며, 파이썬에서는 간편하게 문자열에 유니코드 문자를 추가하여 다양한 언어로 작성된 텍스트를 다룰 수 있습니다. 이를 통해 다국어 처리와 유니코드 문자 조합에 대한 이해를 높일 수 있습니다.