일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 형태소분석기
- input
- iNT
- 머신러닝
- 데이터 분석
- 태블로
- Python
- selenium
- 파이썬
- 인공지능
- Word Cloud
- ionehotencoding
- 시각화
- pandas
- scikit-learn
- Tableau
- Udemy
- 크롤링
- Okt
- konlpy
- numpy
- SQL
- 데이터
- 데이터분석
- pyspark
- Today
- Total
반전공자
R #데이터 파악하기 본문
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.)
오늘은,,, 데이터 파악하고 분석방향 잡는 방법을 배워보도록 하겠슴둥.
분석을 어떻게 하는건지가 가장가장 궁금하다..
뭔가 분! 석! 이라고 하면 거창한게 있을 것 같고,, 굉장히 어려울 것만 같은 기분이 들기 때문이지,,
# 데이터 파악함수
head() - 데이터 앞부분 (6번째 데이터까지 보여줌)
tail() - 데이터 뒷부분 (뒤에서부터 6번째 데이터부터 총 6줄의 데이터 보여줌)
View() - 표 자체를 보여준다 (데이터 프레임 보여주기)
dim() - 몇 행, 몇 줄이 있는지 보여준다!
str() - 자료의 자료형과 어떤 자료들이 있는지 간략히 보여주기
summary() - 각 열 별로 최소값, 평균, 중간값들을 보여준다.
각 함수별로 실행한 결과가 어떻게 나오는지 살펴보자!
위는 기본 데이터 파악 함수를 실행시켜보고 그 결과를 살펴보았는데, 그렇다면 내가 원하는 자료를 뽑기도 가능할까?
-> 위에서부터 n개의 자료, 아래에서부터 n개의 자료 추출 가능!
-> head(exam, 10) => 10번째 줄까지 추출
-> tail(exam, 10) => 뒤에서부터 10번째줄까지 추출
# mpg 데이터 분석
이제 우리가 쉽게 작성할 수 있는 데이터가 아닌 실제! 데이터를 불러와서 실습해볼까?
이전 작성한 글 중 그래프 그렸던 글에서 사용했던 mpg 데이터를 사용해보자!
1. 데이터 -> 데이터 프레임 형식으로 바꿔주기
mpg <- as.data.frame(ggplot2::mpg)
- ggplot2에 있는 mpg를 불러오거라
불러와진 데이터를 보려고 mpg를 실행시키면 보기 힘들게 나오니,, View(mpg)를 실행시켜 표 형태로 편하게 보자!
보아하니,, 차량 종류(audi = 아우디)와 모델명, 배기량 등등등.. 이 있고 오른쪽으로 더 많은 열이 있다!
행도 너무나 많은 것 같길래,, dim(mpg)를 통해 행과 열이 몇 개가 있는지 보았는데 행이 234개, 열이 11개가 존재한다는 것을 알게되었다!
이 데이터를 가지고 무엇을 알 수 있는지 대략 파악하기 위해 summary(mpg)를 실행시켜 보았다!
여기서 주의깊게 볼 자료는 hwy(고속도로연비), cty(도시연비)인데 간단하게 해석해보도록 하겠당
- hwy
자동차들은 고속도록에서 평균적으로 23.44 마일을 주행한다.
연비가 가장 낮은 차량은 12 마일, 최대 44마일 주행 가능!
차량의 연비는 대략 18마일~27마일에 분포되어있음.
- cty
자동차들은 고속도로에서 평균 16.86 마일 주행
연비 가장 낮은 차량은 9마일, 최대 35마일 주행가능!
차량 연비는 대략 14마일~19마일 사이에 분포되어있음!
빨리,,, 데이터 분석,, 해보고 싶어요,,,
지금은 배우는 과정이라 이론적인 부분이 많다..
나중엔 서툴지만 스스로 분석을 해보다 보면 흥미가 더 생길 것 같다!
생각해보니,, 항상 이론은 재미없고 실습이 재미있당.
R은 이론도 실습을 통해 배우니까 재미있지만, 내 맘대로 분석 해보고 싶습니다...
'데이터분석 > R' 카테고리의 다른 글
R # 파생변수 (0) | 2021.01.22 |
---|---|
R # 변수명 바꾸기 (0) | 2021.01.21 |
R # 데이터 불러오기 (0) | 2021.01.20 |
R #data frame (0) | 2021.01.19 |
R #packages, 그래프 그리기, data frame (0) | 2021.01.17 |