데청캠 연세대
[Pandas] Series 실습
하연01
2021. 7. 4. 00:31
import random
import pandas as pd
from pandas import Series
* 시리즈 앞에 pd를 붙이기 번거로우니 그냥 Series를 임포트했다.
cf) 리스트 편하게 만들기?
list('ABCDEFG')
list 함수를 사용하면 알아서 값을 나눠서 넣어준다.
# 데이터 생성
sample = random.sample(range((1,100),26)
data = Series(sample, index = list('ABCDEFGHIJKLMNOPRSTUVWXYZ'))
# 인덱스 라벨이 'K'인 항목 선택
sample['K']
# 인덱스 라벨이 'A','F','C' 인 항목 선택
* 여러개의 인덱스를 찾고 싶을 때에는 리스트 안에 넣어준다.
sample[['A','F','C']]
지정한 순서대로 나온다.
# 5번 인덱스부터 15번 인덱스까지의 항목 선택
sample[5:16]
슬라이싱을 할 때 숫자는 엔드 인덱스를 포함하지 않고 반환하기 때문에 16으로 지정해주어야 15번 데이터까지 나온다.
# 뒤에서 5개 항목 선택
sample[-5:]
# data의 항목 갯수를 출력
data.size
# data 항목 값들의 평균보다 큰 항목만 선택
data[data > data.mean()]
# data 항목 중 값이 50인 항목이 있는지 확인, True or False 로 반환
50 in data
50 in data.values
# data의 인덱스 라벨과 각 항목 값을 index: XX, values: XX 의 형식으로 출력
for idx, val in data.items():
print("index: ", idx, ", values: ", val)
* data.items()
: for 루프를 돌아야할 때, 이 함수를 활용하면 인덱스와 값을 동시에 불러올 수 있다.