[python] 파이썬 pandas에서 SQL 데이터베이스와 연동하는 방법은 무엇인가요?

파이썬의 pandas 라이브러리는 데이터 분석 및 조작에 매우 유용하며, SQL 데이터베이스와의 연동도 가능합니다. 여기서는 pandas를 사용하여 SQL 데이터베이스와 연동하는 방법에 대해 알아보겠습니다.

1. 필요한 라이브러리 설치

먼저, pandas와 함께 SQL 데이터베이스 연동을 위해 추가적으로 필요한 라이브러리들을 설치해야 합니다. 주로 사용되는 라이브러리들은 다음과 같습니다:

pip install sqlalchemy
pip install pyodbc		# 만약 MSSQL 데이터베이스를 사용한다면
pip install pymysql		# 만약 MySQL 데이터베이스를 사용한다면

2. SQL 데이터베이스 연결

pandas에서 SQL 데이터베이스와 연동하려면 먼저 SQLAlchemy 라이브러리를 사용하여 해당 데이터베이스에 연결해야 합니다.

import pandas as pd
from sqlalchemy import create_engine

# 연결 문자열 생성
# - 데이터베이스 유형에 따라 다르므로, 자신의 데이터베이스 유형과 정보에 맞게 설정해야 합니다.
# - 예시: MySQL 데이터베이스의 연결 문자열
conn_str = 'mysql+pymysql://username:password@host/database_name'

# 데이터베이스 연결
engine = create_engine(conn_str)

3. 데이터베이스 테이블을 DataFrame으로 불러오기

이제, 연결된 데이터베이스에서 원하는 테이블을 pandas의 DataFrame으로 불러올 수 있습니다.

# SQL 쿼리를 통해 데이터 로드
query = 'SELECT * FROM table_name'
df = pd.read_sql(query, con=engine)

위 코드에서 SELECT * FROM table_name 부분을 자신이 원하는 쿼리로 변경하여 특정 조건이나 특정 열의 데이터를 불러올 수 있습니다.

결론

이제 pandas를 사용하여 SQL 데이터베이스와 연동하는 방법에 대해 간략히 알아보았습니다. 이를 통해 파이썬으로 데이터베이스와의 연동 및 데이터 분석 작업을 효과적으로 수행할 수 있습니다.

더 자세한 내용은 pandas 공식 문서를 참고하시기 바랍니다.