일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pandas
- 태블로
- scikit-learn
- Word Cloud
- 데이터분석
- selenium
- 머신러닝
- ionehotencoding
- 데이터
- 크롤링
- input
- 파이썬
- 형태소분석기
- 인공지능
- Okt
- Tableau
- Python
- 데이터 분석
- numpy
- konlpy
- Udemy
- 시각화
- pyspark
- iNT
- SQL
Archives
- Today
- Total
반전공자
R - [ 실습: 수면제 효과도 분석 ]: sleep 데이터 활용 본문
# 최면성 약물을 10명의 환자에게 투여했을 때 수면 시간의 증가를 기록한 데이터
# Extra : 수면시간 증가량
# Group : 그룹 ID
# ID : 환자 ID
Q1. 두개의 수면제는 다른 효과를 나타내는가?
sleep2 = sleep[, -3]
sleep2
tapply(sleep2$extra, sleep2$group, mean)
# tapply : 그룹에 따라 평균 구하도록 함
var.test(extra~group, sleep2)
분산이 같은가?
>> p-value가 0.05보다 크기 때문에 귀무가설을 채택한다.
[ 분산이 같다. ]
** 데이터의 개수가 30개를 넘기 때문에 정규성 검증은 진행하지 않고 바로 t-test를 수행한다.
t.test(extra~group, sleep2, paired=FALSE, var.equal=TRUE)
>> p-valuerk 0.05보다 크기 때문에 귀무가설을 채택한다.
H0(귀무가설) : 평균에 유의한 차이가 없다.
H1(대립가설) : 평균에 유의한 차이가 있다.
[ 평균 수면 시간 증가량에 차이가 없다. ]
Q2. 개인별로 볼 때 서로 다른 약물의 수면 시간 증가폭은 다르다고 할 수 있는가? 어느것이 더 많은 수면 시간 증가를 가져오는가?
with(sleep, t.test(extra[group==1], extra[group==2], paired=TRUE))
>> p-value가 0.05보다 작기 때문에 귀무가설을 기각하고 대립가설을 채택한다.
[ 두 수면제의 수면 증가 정도가 다르다. ]
95%의 신뢰구간에서는 -2.45 ~ -0.7 사이에 값이 존재할 것이다.
** mean of the differences가 음수이기 때문에 group2의 평균이 더 높음을 알 수 있다. (group1-group2)
'데이터분석 > R' 카테고리의 다른 글
R - ANOVA(아노바) / PlantGrowth (ANOVA, Tukey HSD) (0) | 2021.05.23 |
---|---|
R - 비율검정 (0) | 2021.05.13 |
R - 분석방법 (카이제곱, 피셔검정, KS검정, Shapiro 검정, t-test) (0) | 2021.05.12 |
R - 난수, 분포함수 (0) | 2021.05.12 |
R - welfare.csv, 결측치 대체 함수 작성 (0) | 2021.05.09 |