일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Python
- 태블로
- 크롤링
- konlpy
- 파이썬
- 데이터 분석
- pyspark
- selenium
- 데이터분석
- 머신러닝
- 시각화
- Tableau
- input
- pandas
- Word Cloud
- 데이터
- ionehotencoding
- Udemy
- 형태소분석기
- iNT
- numpy
- scikit-learn
- SQL
- Okt
- 인공지능
- Today
- Total
목록전체 글 (134)
반전공자
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다." (일개 대학생입니다.) 분석과정을 혼자 해보긴 했지만 배운지 얼마 안됐기 때문에 금방 까먹을 것 같아서 처음부터 다시 다 해보기로 했다! (+ 일요일이기도 하고!) 처음부터 다시 하려니 기억이 잘 나지 않기도 하고 헷갈려서 어려웠는데 찾아가며 푸는 과정도 도움이 되었다. 내가 생각하는 분석 단계는 1, 데이터 불러오기 2. 데이터 전처리 3. 유의미한 값 추출하기 4. 그래프 그려보기 이며 이대로 분석해보려 한다. # 데이터 전처리에 필요한 dplyr 불러오기 # 데이터 시각화에 필요한 ggplot2 불러오기 library(dplyr) library(ggplot2) # mpg 데이터 불러오기 # mpg 데이터 표로 한..
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다." (일개 대학생입니다.) 진짜.. 정말 mpg 데이터와 midwest 데이터를 다루면서 원했던 것이 이거야! 많은 행과 열로 이루어진 데이터에서 내가 필요한 것만 보고싶은데,,, 너무 많으니까 찾기가 너무 힘들단 생각이 들었는데 여기에 딱 필요한 " 데이터 가공 " 에 대해서 오늘 배워보려한다! # 데이터 전처리 1. dplyr 함수 데이터 전처리를 위해서는 패키지가 필요하다. 이전에 변수명 변경을 위해 썼던 rename() 함수가 포함되어있던 dplyr이 바로 데이터 전처리 패키지다!! 먼저 어떤 함수들이 필요한지 배워보겠다. 기본적으로 먼저 필요한 행과 열을 추출하는 함수? - filter() 행 추출 ⇒ 간단하게 ..
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다." (일개 대학생입니다.) 교재 123p에 있는 분석 실습 문제를 혼자 풀어보도록 하겠다! 데이터를 불러오고 분석에 용이하도록 정보를 추가한 다음에 분석을 진행해보려 한다! # 실습 1. ggplot2 패키지 안에 있는 midwest 데이터 불러오기 먼저 데이터가 어떻게 생겼고 어떤 정보가 들어있는지 보기 위해 head()를 이용해 6번째 줄을 뽑아보았다. mid 다음 단계인 " 변수명 변경 " 역할인 rename() 함수를 쓰기 위해서는 dplyr 패키지를 다운로드 받아야 한다. library(dplyr) 그 다음 단계에서 그래프를 그려야하기 때문에 ggplot2도 불러온다. library(ggplot2..
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다." (일개 대학생입니다.) # 파생변수 우린 계속해서 변수에 대해 배우고 있다. 우리가 가진 데이터를 가지고 분석을 하려면 평균을 내거나, 하위 n%를 계산하는 과정이 필요할텐데, 매번 계산하는 과정을 거친다면 매우매우 귀찮을 것이다! 때문에 수를 계산해서 아예 열로 포함시켜버리도록 하는 것이 " 파생변수 " 이다. 새로운 실습을 위해 데이터 프레임을 만들어볼까?! df 20을 넘지 못한 경우엔 " 불합격! " # 조건문 여기서 쓰이는 함수? 조건문 함수 ifelse() - 형식 ifelse(조건, 조건맞을 때 부여할 것, 조건 안맞을 때 부여할 것) 연비 합격, 불합격을 위한 조건문을 작성해볼까? ifelse(mpg$t..
" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. "(일개 대학생입니다.) # 변수명 바꾸기 rename 우리는 왜 변수명을 바꿔야하는가?! 항상 불러오는 데이터의 정보가,,, 자료 이름에 맞게 딱딱 변수명도 지정되면 좋으련만,, 우리가 쓰게 될 데이터들은 그렇지 않을때가 분명이 있기 때문에,, " 이 해 하 기 쉽 게 ! " 꼭 바꿔주어야 한다. -> rename() 실습을 위해 변수명을 var1, var2로 둔 데이터 프레임 df_raw를 만들었다! df_raw 그럼 복사본을 만들자! 복사본을 만든다는 게 거창한 것이 아니오라, 다른 데이터 프레임 명을 할당해주는 것! df_new

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 오늘은,,, 데이터 파악하고 분석방향 잡는 방법을 배워보도록 하겠슴둥. 분석을 어떻게 하는건지가 가장가장 궁금하다.. 뭔가 분! 석! 이라고 하면 거창한게 있을 것 같고,, 굉장히 어려울 것만 같은 기분이 들기 때문이지,, # 데이터 파악함수 head() - 데이터 앞부분 (6번째 데이터까지 보여줌) tail() - 데이터 뒷부분 (뒤에서부터 6번째 데이터부터 총 6줄의 데이터 보여줌) View() - 표 자체를 보여준다 (데이터 프레임 보여주기) dim() - 몇 행, 몇 줄이 있는지 보여준다! str() - 자료의 자료형과 어떤 자료들이 있는지 간략히 보여주기 summary() - 각 열 별로..

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 엑셀을 과연 R로 어떻게 불. 러. 올. 것. 인. 가. ! 파일이 정말,,, 중구난방이 되어있기에,,, 다시 파일 지정을 다시 해줬다ㅠㅠㅠㅠ R에서 getwd()을 실행시키면 현재 어떤 파일로 지정되어있는가를 보여준다. setwd()로도 파일지정이 가능하다고 하지만 나는 tools로 들어가서 직접 지정해주었다! 겨우겨우,, 파일 지정을 해주고 그 안에 엑셀파일을 넣었다. github.com/youngwoos/Doit_R/blob/master/Data/excel_exam.xlsx youngwoos/Doit_R 저장소. Contribute to youngwoos/Doit_R development b..

데이터 프레임을 배워보는 시간을 가져보도록 하게쒀용..! " 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) # data frame 먼저 데이터의 형식을 알아보자! 우리가 흔히 보는 엑셀을 생각하면 될 것 같다. 행(가로)과 열(세로)로 이루어진 데이터 형태를 데이터 프레임이라고 한다. 열 - 컬럼, 변수 행 - 로, 케이스 보통 행은 주체 (개인, 도시, ...)이고 열은 그 주체 별 특징 (나이, 성별, 면적, 인구밀도)이 되겠다. Q. 행이 많은게 중요해? 열이 많은게 중요해? -> 열이 많은 게 중요해! (행이 많은건 메모리, CPU로 커버쳐야하지만, 열이 많은 건 고급 분석 방법을 써야하니까..!) 실제로 R에서 데이터 프레임을 쓸 경우엔..

" 쉽게 배우는 R 데이터 분석 " 을 교재로 하여 공부하는 과정을 작성한 글입니다. (일개 대학생입니다.) 알알..>! 1학년 때 "경상통계학"에서 R을 배웠지만,, R만 가르치는 강의도 아니었고,,, 대충 배웠기에,,, 지금부터 다시 할 것이다...... ㅎㅡㅎ 하다보니 쩜 재밌어서 맛들릴것 같사오다,, 오늘은 패키지, 데이터프레임에 대해서 보려고 합니둥. # packages 패키지에는 여러 종류가 있는데 가장 먼저 통계! 하면 생각나는게 그래프이기 때문에 그래프를 보여주는 패키지를 다운받도록 한다! --> ggplot2 다운 받는 문장은 아래와 같다. install.packages("ggplot2") 꼭 ""를 붙여줘야한다! 안붙여주면 변수명으로 이해하고 에러가 날 수 있기 때문에,, # 그래프 그..
2020.12.09 둘째날 # for for 아이템 in 바구니: [실행구문] # while while [조건식]: [실행구문] # 한번에 하나씩 1~100 number=1 while number bmi를 계산할 때 몸무게와 키를 얻어야 하는데 각 값에 문자가 들어간다면 다시 입력받도록(무한루프)함. 화면을 보면, 문자를 받았을 때에는 숫자를 입력받을 때 까지 계속해서 입력창을 띄우고 두 값 모두 제대로 받았다면 bmi 계산하여 결과출력 윤년 계산 위에는 윤년 변수에 수를 지정해놓은 것 아래에는 datetime의 연도를 불러오도록 한 것 [로또 번호 추출 코드] -> 너무 복잡해!! numbers= list(range(1,46)) game=random.sample(numbers, 6) -> 간단하게 45..