[python] 데이터 인코딩(Encoding) 방법

데이터 인코딩은 데이터를 다른 형식으로 변환하는 과정을 의미합니다. 이를 통해 데이터를 저장하고 전송하는데 각종 알고리즘과 방식을 사용할 수 있습니다. Python에서는 다양한 인코딩 방법을 제공하며, 이를 적절히 사용하여 데이터를 변환할 수 있습니다.

1. ASCII 인코딩

ASCII(미국 정보 교환 표준 부호)는 가장 기본적인 문자 인코딩 방식입니다. ASCII는 7비트로 표현되며, 영문 대소문자, 숫자, 특수문자를 나타낼 수 있습니다.

예시 코드:

text = "hello"
ascii_encoded = text.encode('ascii')
print(ascii_encoded)

2. UTF-8 인코딩

UTF-8(유니코드 변환 형식 8비트)은 전 세계의 대부분의 문자를 표현하기 위해 사용되는 가변 길이 인코딩 방식입니다. UTF-8은 ASCII와 호환되며, 다양한 언어의 문자를 표현할 수 있습니다.

예시 코드:

text = "안녕하세요"
utf8_encoded = text.encode('utf-8')
print(utf8_encoded)

3. URL 인코딩

URL 인코딩은 URL에 사용할 수 없는 문자들을 % 기호와 16진수 값으로 인코딩하는 방식입니다. 이를 통해 안전하게 URL을 전송하고 저장할 수 있습니다.

예시 코드:

import urllib.parse

url = "https://www.example.com/한글"
url_encoded = urllib.parse.quote(url)
print(url_encoded)

4. Base64 인코딩

Base64 인코딩은 이진 데이터를 ASCII 문자로 인코딩하는 방식입니다. 주로 이메일이나 XML 등에서 바이너리 데이터를 안전하게 전송하기 위해 사용됩니다.

예시 코드:

import base64

data = b'hello'
base64_encoded = base64.b64encode(data)
print(base64_encoded)

위에서 소개한 인코딩 방법은 Python에서 자주 사용되는 일부 방법입니다. 데이터 인코딩은 데이터 처리의 중요한 부분이므로, 다양한 상황과 요구에 맞게 적절한 인코딩 방식을 선택하는 것이 중요합니다.

참고 문서: