[파이썬][pandas] pandas에서 Series 생성

pandas는 파이썬의 데이터 분석 라이브러리로서, 다양한 데이터 구조를 제공합니다. 그 중에서도 Series는 1차원 배열 형태의 데이터 구조를 나타내는데, 이를 통해 인덱스를 기반으로 데이터를 처리할 수 있습니다.

Series 생성하기

Series를 생성하는 가장 간단한 방법은 리스트를 사용하는 것입니다. 다음은 예시입니다:

import pandas as pd

data = [10, 20, 30, 40, 50]
series = pd.Series(data)
print(series)

이 코드는 다음과 같은 Series를 생성합니다:

0    10
1    20
2    30
3    40
4    50
dtype: int64

Series는 값과 인덱스로 구성되어 있습니다. 위의 예시에서는 값은 10, 20, 30, 40, 50 이고, 인덱스는 0부터 4까지의 정수로 설정되었습니다.

리스트 외에도 다양한 데이터 구조를 사용하여 Series를 생성할 수 있습니다. 예를 들어, 딕셔너리를 사용하는 방법도 있습니다:

import pandas as pd

data = {'A': 10, 'B': 20, 'C': 30}
series = pd.Series(data)
print(series)

이 코드는 다음과 같은 Series를 생성합니다:

A    10
B    20
C    30
dtype: int64

위의 예시에서는 딕셔너리의 키가 인덱스로 설정되고, 키에 해당하는 값이 Series의 값으로 설정됩니다.

Series를 생성할 때는 자료형도 지정할 수 있습니다. 예를 들어, 위의 예시에서 자료형을 float로 지정하려면 다음과 같이 작성할 수 있습니다:

series = pd.Series(data, dtype=float)

위의 코드는 Series의 자료형을 float으로 설정합니다.

Series 인덱스 접근하기

Series는 인덱스를 통해 원하는 요소에 접근할 수 있습니다. 인덱스는 0부터 시작하며, 정수 인덱스뿐만 아니라 문자열 인덱스도 사용할 수 있습니다.

print(series[0])  # 첫 번째 요소에 접근
print(series['A'])  # 'A'라는 인덱스의 요소에 접근

위의 코드는 각각 10과 10을 출력합니다.

Series 연산하기

Series에는 다양한 연산을 수행할 수 있습니다. 일반적인 연산은 요소별로 수행되며, Series의 각 요소에 대해서 동일한 연산이 수행됩니다.

print(series * 2)  # 모든 요소에 2를 곱함
print(series + 5)  # 모든 요소에 5를 더함

위의 코드는 각각 모든 요소에 2를 곱한 결과와 모든 요소에 5를 더한 결과를 출력합니다.

결론

pandas의 Series는 1차원 배열 형태의 데이터 구조로서, 인덱스 기반으로 데이터를 처리하는데 유용합니다. Series를 생성하고 접근하고 연산하는 방법을 학습하여, 데이터 분석 작업에 유용하게 활용할 수 있습니다.