일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- input
- pyspark
- 형태소분석기
- Python
- 크롤링
- selenium
- ionehotencoding
- 데이터
- 태블로
- 인공지능
- 시각화
- Word Cloud
- SQL
- 데이터 분석
- Okt
- Tableau
- scikit-learn
- 파이썬
- Udemy
- 데이터분석
- konlpy
- numpy
- pandas
- 머신러닝
- iNT
- Today
- Total
목록데이터분석/R (36)
반전공자
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다." (일개 대학생입니다.) # 파생변수 우린 계속해서 변수에 대해 배우고 있다. 우리가 가진 데이터를 가지고 분석을 하려면 평균을 내거나, 하위 n%를 계산하는 과정이 필요할텐데, 매번 계산하는 과정을 거친다면 매우매우 귀찮을 것이다! 때문에 수를 계산해서 아예 열로 포함시켜버리도록 하는 것이 " 파생변수 " 이다. 새로운 실습을 위해 데이터 프레임을 만들어볼까?! df 20을 넘지 못한 경우엔 " 불합격! " # 조건문 여기서 쓰이는 함수? 조건문 함수 ifelse() - 형식 ifelse(조건, 조건맞을 때 부여할 것, 조건 안맞을 때 부여할 것) 연비 합격, 불합격을 위한 조건문을 작성해볼까? ifelse(mpg$t..
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. "(일개 대학생입니다.) # 변수명 바꾸기 rename 우리는 왜 변수명을 바꿔야하는가?! 항상 불러오는 데이터의 정보가,,, 자료 이름에 맞게 딱딱 변수명도 지정되면 좋으련만,, 우리가 쓰게 될 데이터들은 그렇지 않을때가 분명이 있기 때문에,, " 이 해 하 기 쉽 게 ! " 꼭 바꿔주어야 한다. -> rename() 실습을 위해 변수명을 var1, var2로 둔 데이터 프레임 df_raw를 만들었다! df_raw 그럼 복사본을 만들자! 복사본을 만든다는 게 거창한 것이 아니오라, 다른 데이터 프레임 명을 할당해주는 것! df_new

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 오늘은,,, 데이터 파악하고 분석방향 잡는 방법을 배워보도록 하겠슴둥. 분석을 어떻게 하는건지가 가장가장 궁금하다.. 뭔가 분! 석! 이라고 하면 거창한게 있을 것 같고,, 굉장히 어려울 것만 같은 기분이 들기 때문이지,, # 데이터 파악함수 head() - 데이터 앞부분 (6번째 데이터까지 보여줌) tail() - 데이터 뒷부분 (뒤에서부터 6번째 데이터부터 총 6줄의 데이터 보여줌) View() - 표 자체를 보여준다 (데이터 프레임 보여주기) dim() - 몇 행, 몇 줄이 있는지 보여준다! str() - 자료의 자료형과 어떤 자료들이 있는지 간략히 보여주기 summary() - 각 열 별로..

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 엑셀을 과연 R로 어떻게 불. 러. 올. 것. 인. 가. ! 파일이 정말,,, 중구난방이 되어있기에,,, 다시 파일 지정을 다시 해줬다ㅠㅠㅠㅠ R에서 getwd()을 실행시키면 현재 어떤 파일로 지정되어있는가를 보여준다. setwd()로도 파일지정이 가능하다고 하지만 나는 tools로 들어가서 직접 지정해주었다! 겨우겨우,, 파일 지정을 해주고 그 안에 엑셀파일을 넣었다. github.com/youngwoos/Doit_R/blob/master/Data/excel_exam.xlsx youngwoos/Doit_R 저장소. Contribute to youngwoos/Doit_R development b..

데이터 프레임을 배워보는 시간을 가져보도록 하게쒀용..! " 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) # data frame 먼저 데이터의 형식을 알아보자! 우리가 흔히 보는 엑셀을 생각하면 될 것 같다. 행(가로)과 열(세로)로 이루어진 데이터 형태를 데이터 프레임이라고 한다. 열 - 컬럼, 변수 행 - 로, 케이스 보통 행은 주체 (개인, 도시, ...)이고 열은 그 주체 별 특징 (나이, 성별, 면적, 인구밀도)이 되겠다. Q. 행이 많은게 중요해? 열이 많은게 중요해? -> 열이 많은 게 중요해! (행이 많은건 메모리, CPU로 커버쳐야하지만, 열이 많은 건 고급 분석 방법을 써야하니까..!) 실제로 R에서 데이터 프레임을 쓸 경우엔..

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 알알..>! 1학년 때 "경상통계학"에서 R을 배웠지만,, R만 가르치는 강의도 아니었고,,, 대충 배웠기에,,, 지금부터 다시 할 것이다...... ㅎㅡㅎ 하다보니 쩜 재밌어서 맛들릴것 같사오다,, 오늘은 패키지, 데이터프레임에 대해서 보려고 합니둥. # packages 패키지에는 여러 종류가 있는데 가장 먼저 통계! 하면 생각나는게 그래프이기 때문에 그래프를 보여주는 패키지를 다운받도록 한다! --> ggplot2 다운 받는 문장은 아래와 같다. install.packages("ggplot2") 꼭 ""를 붙여줘야한다! 안붙여주면 변수명으로 이해하고 에러가 날 수 있기 때문에,, # 그래프 그..