[python] 파이썬으로 MongoDB의 데이터 후처리하기

이번 포스트에서는 파이썬을 사용하여 MongoDB 데이터를 후처리하는 방법에 대해 알아보겠습니다. MongoDB는 많은 데이터를 저장하고 검색할 수있는 유연한 NoSQL 데이터베이스입니다. 그러나 때로는 저장된 데이터를 쿼리하거나 분석하기 전에 전처리해야 할 수도 있습니다. 이를 위해 파이썬을 사용하여 데이터를 깔끔하게 변환하고 필요한 형식으로 조작할 수 있습니다.

MongoDB 연결

먼저, 파이썬에서 MongoDB에 연결해야 합니다. 이를 위해 pymongo 라이브러리를 사용합니다. 아래의 코드를 사용하여 MongoDB에 연결할 수 있습니다.

import pymongo

# MongoDB에 연결
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 데이터베이스 선택
db = client["mydatabase"]

# 컬렉션 선택
collection = db["mycollection"]

위의 코드에서 localhost는 MongoDB가 실행 중인 호스트의 주소를 나타내며, 27017은 MongoDB가 사용하는 기본 포트 번호입니다. mydatabase는 사용할 데이터베이스 이름이고, mycollection은 사용할 컬렉션 이름입니다.

데이터 후처리

이제 MongoDB에서 데이터를 쿼리하고 후처리하는 방법을 살펴보겠습니다. 예를 들어, mycollection 컬렉션에 다음과 같은 문서가 있다고 가정해 보겠습니다.

{
    "_id": 1,
    "name": "John",
    "age": 25,
    "city": "New York"
}

이 문서에서 데이터를 추출하고 필요한 형식으로 변환하려면 다음과 같이 코드를 작성할 수 있습니다.

# 데이터 쿼리
data = collection.find_one({"_id": 1})

# 필드 추출
name = data["name"]
age = data["age"]
city = data["city"]

# 데이터 변환
name_upper = name.upper()
age_str = str(age)

# 데이터 출력
print(f"Name: {name_upper}")
print(f"Age: {age_str}")
print(f"City: {city}")

위의 코드에서 find_one() 메서드를 사용하여 _id 필드가 1인 문서를 찾고, 필요한 필드를 추출합니다. 추출된 필드를 원하는 방식으로 변환한 다음, 출력합니다.

결론

이제 파이썬을 사용하여 MongoDB 데이터를 후처리하는 방법을 알게 되었습니다. 데이터를 쿼리하고 원하는 방식으로 변환하여 활용할 수 있습니다. 파이썬과 MongoDB의 조합은 강력한 데이터 처리 도구를 제공합니다.

참고 자료: