[python] 주피터 노트북에서 데이터베이스 연동하기

주피터 노트북(Jupyter Notebook)은 데이터 과학 및 데이터 분석에 매우 유용한 툴입니다. 주피터 노트북을 사용하여 데이터베이스에 연결하고 데이터를 쿼리하는 방법을 알아보겠습니다.

필요한 패키지 설치

Python에서 데이터베이스에 연결하기 위해서는 보통 pandas, sqlalchemy, psycopg2(PostgreSQL의 경우) 등의 패키지가 필요합니다. 만약 이러한 패키지가 설치되어 있지 않다면, 다음과 같이 설치할 수 있습니다.

!pip install pandas sqlalchemy psycopg2

데이터베이스 연동 예시

아래는 PostgreSQL 데이터베이스에 연결하여 데이터를 불러오는 간단한 예시입니다.

from sqlalchemy import create_engine
import pandas as pd

# 데이터베이스 연결을 위한 정보
username = 'your_username'
password = 'your_password'
host = 'database_host'
port = 'database_port'
database = 'your_database'

# 데이터베이스 연결 엔진 생성
engine = create_engine(f'postgresql://{username}:{password}@{host}:{port}/{database}')

# SQL 쿼리 실행하여 데이터프레임으로 불러오기
query = 'SELECT * FROM your_table'
df = pd.read_sql(query, engine)

# 불러온 데이터 확인
df.head()

결론

이제 주피터 노트북을 사용하여 데이터베이스에 연결하고 데이터를 쿼리하는 방법에 대해 알아보았습니다. 이를 통해 데이터 과학 및 데이터 분석 작업에 필요한 데이터를 효율적으로 관리하고 활용할 수 있을 것입니다.

더 많은 정보를 원하신다면, SQLAlchemy 공식 문서를 참고하시기 바랍니다.