[Python데이터시각화] 1. Overview 및 개발환경 구축
Python을 활용한 시각화
- Pandas를 통한 데이터 분석 후에 시각화를 통해 데이터에 대한 이해도를 높일 수 있습니다.
다양한 시각화 라이브러리
- 정적 이미지 생성
- Matplotlib, Seaborn 등
- Interactive 시각화 라이브러리
- Bokeh, d3py 등
개발환경 구축
- Excel
- 윈도우용 Excel 2007 이상
- 맥용 Excel 2016 이상
- Python
- Jupyter Notebook
- 아나콘다 파이썬에 이미 설치되어 있음
필요한 라이브러리
- 아나콘다를 통해 기본 설치
- pandas: 데이터 전처리/분석
- matplotlib / seaborn: 시각화
- xlwings: 엑셀 UI 자동화
- scikit-learn: 머신러닝
- requests: HTTP 요청
- beautifulsoup4: HTML 파서
- tqdm: 진행상태 표시 라이브러리
- missingno
- 결측치 시각화
VS Code를 사용한다면
- VS Code에서 Anaconda Extension Pack 설치
- Python 경로를 Anaconda 설치한 폴더 내 Python으로 설정
- Python 버전에 (‘base’: conda) 확인
Conda Environment를 사용한다면
#!/bin/bash
conda create -n 이름 anaconda
activate 이름
jupyter notebook