일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 크롤링
- selenium
- 데이터 분석
- pyspark
- 머신러닝
- 파이썬
- input
- numpy
- 인공지능
- Tableau
- 형태소분석기
- ionehotencoding
- Word Cloud
- Okt
- 태블로
- 데이터분석
- SQL
- 시각화
- pandas
- iNT
- konlpy
- 데이터
- Udemy
- Python
- scikit-learn
Archives
- Today
- Total
반전공자
[Pandas] Series 실습 본문
import random
import pandas as pd
from pandas import Series
* 시리즈 앞에 pd를 붙이기 번거로우니 그냥 Series를 임포트했다.
cf) 리스트 편하게 만들기?
list('ABCDEFG')
list 함수를 사용하면 알아서 값을 나눠서 넣어준다.
# 데이터 생성
sample = random.sample(range((1,100),26)
data = Series(sample, index = list('ABCDEFGHIJKLMNOPRSTUVWXYZ'))
# 인덱스 라벨이 'K'인 항목 선택
sample['K']
# 인덱스 라벨이 'A','F','C' 인 항목 선택
* 여러개의 인덱스를 찾고 싶을 때에는 리스트 안에 넣어준다.
sample[['A','F','C']]
지정한 순서대로 나온다.
# 5번 인덱스부터 15번 인덱스까지의 항목 선택
sample[5:16]
슬라이싱을 할 때 숫자는 엔드 인덱스를 포함하지 않고 반환하기 때문에 16으로 지정해주어야 15번 데이터까지 나온다.
# 뒤에서 5개 항목 선택
sample[-5:]
# data의 항목 갯수를 출력
data.size
# data 항목 값들의 평균보다 큰 항목만 선택
data[data > data.mean()]
# data 항목 중 값이 50인 항목이 있는지 확인, True or False 로 반환
50 in data
50 in data.values
# data의 인덱스 라벨과 각 항목 값을 index: XX, values: XX 의 형식으로 출력
for idx, val in data.items():
print("index: ", idx, ", values: ", val)
* data.items()
: for 루프를 돌아야할 때, 이 함수를 활용하면 인덱스와 값을 동시에 불러올 수 있다.
'데청캠 연세대' 카테고리의 다른 글
[Pandas] DataFrame_attribute(속성) (0) | 2021.07.04 |
---|---|
[Pandas] DataFrame (0) | 2021.07.04 |
[Pandas] Series_indexing (0) | 2021.07.04 |
[Pandas] Series_method (0) | 2021.07.03 |
[Pandas] Series_attribute (0) | 2021.07.03 |