[python] 주피터 노트북에서 데이터베이스 연동하기
주피터 노트북(Jupyter Notebook)은 데이터 과학 및 데이터 분석에 매우 유용한 툴입니다. 주피터 노트북을 사용하여 데이터베이스에 연결하고 데이터를 쿼리하는 방법을 알아보겠습니다.
필요한 패키지 설치
Python에서 데이터베이스에 연결하기 위해서는 보통 pandas
, sqlalchemy
, psycopg2
(PostgreSQL의 경우) 등의 패키지가 필요합니다. 만약 이러한 패키지가 설치되어 있지 않다면, 다음과 같이 설치할 수 있습니다.
!pip install pandas sqlalchemy psycopg2
데이터베이스 연동 예시
아래는 PostgreSQL 데이터베이스에 연결하여 데이터를 불러오는 간단한 예시입니다.
from sqlalchemy import create_engine
import pandas as pd
# 데이터베이스 연결을 위한 정보
username = 'your_username'
password = 'your_password'
host = 'database_host'
port = 'database_port'
database = 'your_database'
# 데이터베이스 연결 엔진 생성
engine = create_engine(f'postgresql://{username}:{password}@{host}:{port}/{database}')
# SQL 쿼리 실행하여 데이터프레임으로 불러오기
query = 'SELECT * FROM your_table'
df = pd.read_sql(query, engine)
# 불러온 데이터 확인
df.head()
결론
이제 주피터 노트북을 사용하여 데이터베이스에 연결하고 데이터를 쿼리하는 방법에 대해 알아보았습니다. 이를 통해 데이터 과학 및 데이터 분석 작업에 필요한 데이터를 효율적으로 관리하고 활용할 수 있을 것입니다.
더 많은 정보를 원하신다면, SQLAlchemy 공식 문서를 참고하시기 바랍니다.