[파이썬] 문자열의 유니코드 문자 조합

유니코드는 전 세계의 모든 문자를 나타내기 위한 표준 인코딩 체계입니다. 파이썬에서 문자열은 유니코드 문자를 조합하여 표현할 수 있습니다. 이번 포스트에서는 파이썬에서 문자열에 유니코드 문자를 조합하는 방법에 대해 알아보겠습니다.

1. 유니코드 문자 표현

파이썬에서 유니코드 문자는 \u 또는 \U 접두사를 사용하여 표현할 수 있습니다. \u는 16진수로 4자리의 유니코드 문자를 표현하고, \U는 16진수로 8자리의 유니코드 문자를 표현합니다.

예를 들어, 아래의 코드는 ‘안’이라는 한글 문자를 유니코드로 표현한 예시입니다.

ch = '\uC548'
print(ch)  # 출력 결과: 안

2. 문자 결합

파이썬에서는 문자열에 유니코드 문자를 결합하는 방법을 제공합니다. + 연산자를 사용하여 문자열과 유니코드 문자를 결합할 수 있습니다.

아래의 코드는 ‘안’이라는 한글 문자와 ‘녕’이라는 한글 문자를 결합하여 ‘안녕’이라는 문자열을 생성하는 예시입니다.

ch1 = '\uC548'
ch2 = '\uB155'
msg = ch1 + ch2
print(msg)  # 출력 결과: 안녕

3. 유니코드 문자 결합 함수

파이썬에서는 chr() 함수를 사용하여 유니코드 코드 포인트 값을 문자로 변환할 수 있습니다. 또한 ord() 함수를 사용하여 문자를 유니코드 코드 포인트 값으로 변환할 수도 있습니다.

아래의 코드는 chr() 함수를 사용하여 유니코드 코드 포인트 값으로부터 문자를 생성하는 예시입니다.

cp = 0xC548
ch = chr(cp)
print(ch)  # 출력 결과: 안

4. 결론

파이썬에서 문자열에 유니코드 문자를 조합하는 방법에 대해 알아보았습니다. 유니코드는 다양한 언어의 문자를 표현하는 데 사용되며, 파이썬에서는 간편하게 문자열에 유니코드 문자를 추가하여 다양한 언어로 작성된 텍스트를 다룰 수 있습니다. 이를 통해 다국어 처리와 유니코드 문자 조합에 대한 이해를 높일 수 있습니다.