[파이썬] 문자열의 유니코드 코드 포인트
유니코드(Unicode)는 문자들을 컴퓨터에서 표현하기 위한 국제 표준이다. 유니코드는 각 문자에 대해 고유한 코드 포인트를 할당하여 문자의 식별과 표현을 가능하게 한다. 파이썬에서는 문자열에 포함된 각 문자의 유니코드 코드 포인트를 확인할 수 있다.
아래는 파이썬에서 문자열의 유니코드 코드 포인트를 확인하는 예제 코드이다.
# 문자열
text = "안녕하세요"
# 문자열의 유니코드 코드 포인트 확인
for char in text:
print(f"{char}: {ord(char)}")
위 코드를 실행하면 “안녕하세요” 문자열의 각 문자에 대한 유니코드 코드 포인트가 출력된다.
출력 결과:
안: 50504
녕: 45397
하: 54616
세: 49436
요: 45124
해당 코드에서는 ord()
함수를 사용하여 각 문자의 유니코드 코드 포인트를 확인하였다. ord()
함수는 문자의 유니코드 코드 포인트를 반환하는 내장 함수이다.
유니코드 코드 포인트를 확인함으로써 언어의 독특한 문자, 이모지 등을 다루거나 특정 문자열 처리를 할 수 있다. 또한 유니코드 코드 포인트를 활용하여 특정 문자를 다른 문자로 치환하는 작업도 가능하다.
파이썬에서 문자열의 유니코드 코드 포인트를 확인할 수 있기 때문에 다양한 문자열 처리 및 분석에 유용하게 활용될 수 있다. 반드시 필요한 경우에는 문자열의 유니코드 코드 포인트를 확인하여 작업하는 것을 추천한다.