일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 인공지능
- 데이터 분석
- 데이터분석
- 머신러닝
- scikit-learn
- input
- 형태소분석기
- 시각화
- Udemy
- selenium
- 태블로
- pyspark
- 파이썬
- pandas
- SQL
- Tableau
- Word Cloud
- ionehotencoding
- 크롤링
- iNT
- Okt
- 데이터
- Python
- konlpy
- numpy
- Today
- Total
반전공자
[Pandas] DataFrame_method 본문
데이터프레임의 기본 함수
info()
: 데이터의 기본 정보 , 데이터 개관
df2.info()
컬럼 명이 무엇인지, null값이 존재하는지, 데이터 값 타입은 무엇인지 보여준다.
describe()
: 기본 통계 정보를 컬럼 별로 보여준다.
df2.describe()
통계 함수
: mean(), sum(), max(), min(), quantile() ...
df2.mean()
♪ 연도 별로 구하고 싶다.
df2.mean(axis=1)
: 행을 기준으로 평균을 구하라
df2.quantile(0.25)
sample()
: 일부 데이터를 랜덤으로 선택 (기본은 컬럼기준이다.)
df2.sample()
df2.sample(2)
도시를 랜덤으로 두개 뽑아보고 싶다.
df2.sample(2, axis=1)
만약 도시를 랜덤하게 10개 뽑고 싶은데 개수가 모자르다면 뽑았던 것을 또 뽑도록 하고 싶다.
df2.sample(n=10, replace=True, axis=1)
replace=True
→ 같은 데이터를 여러번 추출하는 것이 가능하도록 한다.
head()
: 맨 앞의 x개 데이터 출력
df2.head(1)
tail()
: 맨 뒤의 x개 데이터 출력
df2.tail(2)
nunique()
: unique한 값의 개수
df2.nunique()
df2.nunique(axis = 1, dropna=False)
행을 기준으로, null 값을 포함하여 유일값을 세라.
plot()
: 데이터 시각화
df2.plot()
★ 한글이 깨진다면?
2021.07.04 - [데이터분석/Python] - Mac에서 주피터노트북 그래프 한글 깨짐 해결
Mac에서 주피터노트북 그래프 한글 깨짐 해결
맥북에서 그래프를 출력하면 한글이 깨져서 나오는 경우가 많다. 이때에는 matplotlib 패키지를 활용해서 폰트를 지정해주어야 한다. import matplotlib as plt plt.rcParams['font.family'] = 'AppleGothic'
hayeon01.tistory.com
filter()
: 원하는 데이터만 선택
df2.filter(['서울', '대전'])
df2.filter([2019], axis=0)
axis = 0 : 행 기준
[ filter 장점 ]
보고 싶은 행, 열에 들어가는 문자, 숫자를 지정해서 찾아볼 수 있다.
# '대' 로 시작하는 컬럼만 선택
df2.filter(regex = '^대')
# 2010년대 데이터만 선택
df2.filter(regex = '^201', axis=0)
행의 이름이 201로 시작하는 것만 찾는다.
# 10년 단위의 연도 정보만 선택하자. (2000, 2010, 2020, ...)
df2.filter(reges = '0$', axis=0)
0$ : 0으로 끝나는 연도만 선택
axis = 0 : 행 기준
'데청캠 연세대' 카테고리의 다른 글
[데청캠 2022] (0) | 2022.05.10 |
---|---|
[Pandas] DataFrame 조회 (0) | 2021.07.04 |
[Pandas] DataFrame_attribute(속성) (0) | 2021.07.04 |
[Pandas] DataFrame (0) | 2021.07.04 |
[Pandas] Series 실습 (0) | 2021.07.04 |