반전공자

R #데이터 파악하기 본문

데이터분석/R

R #데이터 파악하기

하연01 2021. 1. 20. 23:50

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.)

 

오늘은,,, 데이터 파악하고 분석방향 잡는 방법을 배워보도록 하겠슴둥. 

 

분석을 어떻게 하는건지가 가장가장 궁금하다.. 

 

뭔가 분! 석! 이라고 하면 거창한게 있을 것 같고,, 굉장히 어려울 것만 같은 기분이 들기 때문이지,,

 

 

#  데이터 파악함수 

 

head()  - 데이터 앞부분 (6번째 데이터까지 보여줌)

tail()  - 데이터 뒷부분 (뒤에서부터 6번째 데이터부터 총 6줄의 데이터 보여줌)

View()   -  표 자체를 보여준다 (데이터 프레임 보여주기)

dim()   -  몇 행, 몇 줄이 있는지 보여준다! 

str()  - 자료의 자료형과 어떤 자료들이 있는지 간략히 보여주기

summary()   - 각 열 별로 최소값,  평균, 중간값들을 보여준다. 

 

 

 

 

각 함수별로 실행한 결과가 어떻게 나오는지 살펴보자! 

 

head(exam)

 

 

 

tail(exam)

 

 

 

View(exam)

 

 

 

dim(exam) 행, 열 개수

 

 

str(exam)

 

 

 

 

summary(exam)

 

 

 

 

위는 기본 데이터 파악 함수를 실행시켜보고 그 결과를 살펴보았는데, 그렇다면 내가 원하는 자료를 뽑기도 가능할까? 

 

-> 위에서부터 n개의 자료, 아래에서부터 n개의 자료 추출 가능! 

-> head(exam, 10) => 10번째 줄까지 추출 

-> tail(exam, 10) => 뒤에서부터 10번째줄까지 추출 

 

 

 

 

# mpg 데이터 분석 

 

 

이제 우리가 쉽게 작성할 수 있는 데이터가 아닌 실제! 데이터를 불러와서 실습해볼까? 

 

이전 작성한 글 중 그래프 그렸던 글에서 사용했던 mpg 데이터를 사용해보자! 

 

1. 데이터 -> 데이터 프레임 형식으로 바꿔주기 

       

 mpg <- as.data.frame(ggplot2::mpg)

             - ggplot2에 있는 mpg를 불러오거라

 

불러와진 데이터를 보려고 mpg를 실행시키면 보기 힘들게 나오니,, View(mpg)를 실행시켜 표 형태로 편하게 보자! 

 

 

 

보아하니,, 차량 종류(audi = 아우디)와 모델명, 배기량 등등등.. 이 있고 오른쪽으로 더 많은 열이 있다!

행도 너무나 많은 것 같길래,, dim(mpg)를 통해 행과 열이 몇 개가 있는지 보았는데 행이 234개, 열이 11개가 존재한다는 것을 알게되었다! 

 

 

이 데이터를 가지고 무엇을 알 수 있는지 대략 파악하기 위해 summary(mpg)를 실행시켜 보았다!

 

여기서 주의깊게 볼 자료는 hwy(고속도로연비), cty(도시연비)인데 간단하게 해석해보도록 하겠당 

 

- hwy 

    자동차들은 고속도록에서 평균적으로 23.44 마일을 주행한다. 

    연비가 가장 낮은 차량은 12 마일, 최대 44마일 주행 가능! 

    차량의 연비는 대략 18마일~27마일에 분포되어있음.

 

- cty 

    자동차들은 고속도로에서 평균 16.86 마일 주행 

    연비 가장 낮은 차량은 9마일, 최대 35마일 주행가능! 

    차량 연비는 대략 14마일~19마일 사이에 분포되어있음! 

 

 

 

 

 

 

 

빨리,,, 데이터 분석,, 해보고 싶어요,,, 

 

지금은 배우는 과정이라 이론적인 부분이 많다.. 

 

나중엔 서툴지만 스스로 분석을 해보다 보면 흥미가 더 생길 것 같다! 

 

생각해보니,, 항상 이론은 재미없고 실습이 재미있당. 

 

R은 이론도 실습을 통해 배우니까 재미있지만, 내 맘대로 분석 해보고 싶습니다...

'데이터분석 > R' 카테고리의 다른 글

R # 파생변수  (0) 2021.01.22
R # 변수명 바꾸기  (0) 2021.01.21
R # 데이터 불러오기  (0) 2021.01.20
R #data frame  (0) 2021.01.19
R #packages, 그래프 그리기, data frame  (0) 2021.01.17