[Tensorflow] 4. 표를 다루는 도구 판다스
표를 다루는 도구 ‘판다스’
- 머신러닝 지도학습 과정
- 과거의 데이터를 준비
- 모델의 구조 만들기
- 데이터로 모델을 학습(FIT)
- 모델을 이용
데이터 준비
- 변수
x = 1
x = 2
## 데이터 불러오기
파일경로 = 'lemonade.csv'
데이터 = pd.read_csv(파일경로)
파일경로 = 'bostom.csv'
데이터 = pd.read_csv(파일경로)
날짜 | 요일 | 온도 | 판매량 |
---|---|---|---|
2020.1.3 | 금 | 20 | 40 |
2020.1.4 | 토 | 21 | 42 |
2020.1.5 | 일 | 22 | 44 |
- 변수(Variable)
- 날짜
- 요일
- 온도
- 판매량
[잠깐]
`프로그래밍 관점`에서의 변수와
`데이터 관점`에서의 변수는 의미하는게 조금 다를 수 있으니 주의하자.
2. 독립변수 & 종속변수
날짜 | 요일 | 온도 | 판매량 |
---|---|---|---|
2020.1.3 | 금 | 20 | 40 |
2020.1.4 | 토 | 21 | 42 |
2020.1.5 | 일 | 22 | 44 |
import pandas as pd
## 데이터 불러오기
파일경로 = 'lemonade.csv'
데이터 = pd.read_csv(파일경로)
## 독립변수, 종속변수 분리
독립 = 데이터[['온도']]
종속 = 데이터[['판매량']]
## 데이터 모양 확인
print(독립.shape, 종속.shape)
3. 실습
- 실습을 통해 배울 도구들
- 파일 읽어오기 :
pd.read_csv('/경로/파일명.csv')
- 모양 확인하기 :
print(데이터.shape)
- 칼럼 선택하기 :
데이터[['컬럼명1', '컬럼명2', '컬럼명3']]
- 칼럼 이름 출력하기 :
print(데이터.columns)
- 맨 위 5개 관측치 출력 :
데이터.head()
- 파일 읽어오기 :
- 샘플 데이터
- 레모네이드
- https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv
- 보스턴
- https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv
- 아이리스
- https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv
- 레모네이드
###########################
## 라이브러리 사용
import pandas as pd
###########################
## 파일로부터 데이터 읽어오기
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
레모네이드 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
보스턴 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv'
아이리스 = pd.read_csv(파일경로)
###########################
## 데이터의 모양확인
print(레모네이드.shape)
print(보스턴.shape)
print(아이리스.shape)
###########################
## 데이터 칼럼이름 확인
print(레모네이드.columns)
print(보스턴.columns)
print(아이리스.columns)
###########################
## 독립변수와 종속변수 분리
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]
print(독립.shape, 종속.shape)
독립 = 보스턴[['crim', 'zn', 'indus', 'chas', 'nox',
'rm', 'age', 'dis', 'rad', 'tax',
'ptratio', 'b', 'lstat']]
종속 = 보스턴[['medv']]
print(독립.shape, 종속.shape)
독립 = 아이리스[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
종속 = 아이리스[['품종']]
print(독립.shape, 종속.shape)
###########################
## 각각의 데이터 확인해보기
print(레모네이드.head())
print(보스턴.head())
print(아이리스.head())