반전공자

[Pandas] DataFrame_method 본문

데청캠 연세대

[Pandas] DataFrame_method

하연01 2021. 7. 4. 01:55

데이터프레임의 기본 함수 

 

info() 

: 데이터의 기본 정보 , 데이터 개관 

df2.info()

컬럼 명이 무엇인지, null값이 존재하는지, 데이터 값 타입은 무엇인지 보여준다. 

 

 

 

describe()

: 기본 통계 정보를 컬럼 별로 보여준다. 

df2.describe()

 

 

 

통계 함수 

: mean(), sum(), max(), min(), quantile()  ... 

df2.mean() 

 

♪ 연도 별로 구하고 싶다. 

df2.mean(axis=1) 

: 행을 기준으로 평균을 구하라 

 

df2.quantile(0.25)

 

 

 

sample() 

: 일부 데이터를 랜덤으로 선택 (기본은 컬럼기준이다.)

df2.sample()

 

 

df2.sample(2)

 

 

도시를 랜덤으로 두개 뽑아보고 싶다. 

df2.sample(2, axis=1)

 

 

만약 도시를 랜덤하게 10개 뽑고 싶은데 개수가 모자르다면 뽑았던 것을 또 뽑도록 하고 싶다. 

df2.sample(n=10, replace=True, axis=1)

replace=True

→ 같은 데이터를 여러번 추출하는 것이 가능하도록 한다. 

 

 

 

 

 

head() 

: 맨 앞의 x개 데이터 출력

df2.head(1)

tail() 

: 맨 뒤의 x개 데이터 출력 

df2.tail(2)

 

 

 

nunique() 

: unique한 값의 개수

df2.nunique()

df2.nunique(axis = 1, dropna=False)

행을 기준으로, null 값을 포함하여 유일값을 세라. 

 

 

 

 

 

plot() 

: 데이터 시각화 

df2.plot()

 

★ 한글이 깨진다면?

2021.07.04 - [데이터분석/Python] - Mac에서 주피터노트북 그래프 한글 깨짐 해결

 

Mac에서 주피터노트북 그래프 한글 깨짐 해결

맥북에서 그래프를 출력하면 한글이 깨져서 나오는 경우가 많다. 이때에는 matplotlib 패키지를 활용해서 폰트를 지정해주어야 한다. import matplotlib as plt plt.rcParams['font.family'] = 'AppleGothic'

hayeon01.tistory.com

 


filter() 

: 원하는 데이터만 선택 

df2.filter(['서울', '대전'])

 

df2.filter([2019], axis=0)

axis = 0 : 행 기준

 

 

[ filter 장점 ]

보고 싶은 행, 열에 들어가는 문자, 숫자를 지정해서 찾아볼 수 있다. 

 

# '대' 로 시작하는 컬럼만 선택

df2.filter(regex = '^대') 

 

# 2010년대 데이터만 선택

df2.filter(regex = '^201', axis=0)

행의 이름이 201로 시작하는 것만 찾는다. 

# 10년 단위의 연도 정보만 선택하자. (2000, 2010, 2020, ...) 

df2.filter(reges = '0$', axis=0) 

0$ : 0으로 끝나는 연도만 선택 

axis = 0 : 행 기준 

 

'데청캠 연세대' 카테고리의 다른 글

[데청캠 2022]  (0) 2022.05.10
[Pandas] DataFrame 조회  (0) 2021.07.04
[Pandas] DataFrame_attribute(속성)  (0) 2021.07.04
[Pandas] DataFrame  (0) 2021.07.04
[Pandas] Series 실습  (0) 2021.07.04