- 질문 게시판입니다.
Date | 22/01/10 21:21:18 |
Name | 병아리달 |
Subject | R을 통한 ANOVA 분석에 대해 질문드립니다. |
R에 대해 정확히 one-way ANOVA까지밖에 , 그것도 정말 얕게 아는데, 갑자기 ANCOVA라는 기법까지 하게 되었습니다. (원리는 모르지만) A <-aov(A~group, data=asdf) anova(A) 를 하면 그룹 간의 분산이 그룹 사이의 차이 때문에 나온거다... 이 정도는 압니다. ANCOVA라는 방식은 여러 개의 독립 변인과 하나의 종속 변인이 있을 때, 그 중 하나의 독립 변인을 주요 변인으로 삼고, 다른 변인은 통제 변인으로 두는 방식이라고 하더군요. 여기서 two-way ANOVA라는 친구는 두 개의 독립 변인을 모두 주요 변인으로 삼는 경우라고 들었습니다. 그래서 구글링을 많이 해보니 제가 만약 y이라는 변수에 대해서 a, b, c, d 라는 네 가지 변수를 독립 변수로 놓고 a, b, c를 통제 변인으로 둔 뒤 범주병 변수 d에 대해서 d1 d2 d3 세 그룹에 대해 ANCOVA를 돌리고 싶습니다. 이때 x1 = aov(y~d) 를 하고 anova( x1 )를 하면 제가 아는 anova 분석 결과가 나오지요. x2=lm(y~a+d)를 하면 a를 공변수로 두고 anova(x2)를 해서 d에 대한 분산분석을 수행하는 ancova가 나온다고 구글링을 통해 배웠습니다. 그렇다면 x3=lm(y~a+b+c+d)를 하고 anova(x3)를 한 수행한다면 자동으로 d1 d2 d3에 대한 ancova를 수행했다고 볼 수 있는건가요? 총체적으로 R, anova()함수, 분석에 대해 아는게 없다보니 힘드네요ㅠㅠ 내공 백만점입니다. R에 대한 책이나 사이트도 함께 추천해주시면 감사하겠습니다! 0
|
음... 연습을 위한 가상의 예제인 것인지, 실제 업무를 위한 것인지 몰라서 말씀드리기 조심스럽네요. 우선은 주요 가정을 확인하는 과정을 따라가 보시는 것이 안전할 거예요.
Anova 기초로는 https://rfriend.tistory.com/m/131 요거 참고해보시면 좋을 듯해요. 기본 원리에 대해서도 알려주네요.
처음에
A <-aov(측정값~요인, data=데이터)
anova(A)
로 보신다 하셨던 건 (저는 주로 summary(A... 더 보기
Anova 기초로는 https://rfriend.tistory.com/m/131 요거 참고해보시면 좋을 듯해요. 기본 원리에 대해서도 알려주네요.
처음에
A <-aov(측정값~요인, data=데이터)
anova(A)
로 보신다 하셨던 건 (저는 주로 summary(A... 더 보기
음... 연습을 위한 가상의 예제인 것인지, 실제 업무를 위한 것인지 몰라서 말씀드리기 조심스럽네요. 우선은 주요 가정을 확인하는 과정을 따라가 보시는 것이 안전할 거예요.
Anova 기초로는 https://rfriend.tistory.com/m/131 요거 참고해보시면 좋을 듯해요. 기본 원리에 대해서도 알려주네요.
처음에
A <-aov(측정값~요인, data=데이터)
anova(A)
로 보신다 하셨던 건 (저는 주로 summary(A)로 봅니다만) 귀무가설 H0 : μ1 = μ2 = ... = μr의 기각으로, 샘플 데이터에서의 집단 간 평균 차이가(일부 간의 차이라도) 모집단 수준에서의 평균 차이가 없다는 영가설을 기각할만한 상당한 근거가 있는지를 살펴본다고 생각하시면 좋을 것 같아요.
Anova 기초로는 https://rfriend.tistory.com/m/131 요거 참고해보시면 좋을 듯해요. 기본 원리에 대해서도 알려주네요.
처음에
A <-aov(측정값~요인, data=데이터)
anova(A)
로 보신다 하셨던 건 (저는 주로 summary(A)로 봅니다만) 귀무가설 H0 : μ1 = μ2 = ... = μr의 기각으로, 샘플 데이터에서의 집단 간 평균 차이가(일부 간의 차이라도) 모집단 수준에서의 평균 차이가 없다는 영가설을 기각할만한 상당한 근거가 있는지를 살펴본다고 생각하시면 좋을 것 같아요.
이어서 ancova를 쓰면 이제 분산이 아니라 covariance로 개념이 달라지게 되는데, 어쨌거나 다수의 covariates를 모델에 넣는 것은 가능하다고 알고 있어요. Covariates로 쓸 데이터 타입을 연속형으로 지정해두고, 모델에서 순서만 제대로 지정하시면 굴러갈 것 같습니당
다만 개념적으로 혼란을 막기 위해 https://www.lehigh.edu/~wh02/ancova.html 이 글을 참고해보시면 도움이 될 듯하옵니다.
구글링하셨다니 이미 보셨을 것 같기는 한데, https://www.datanovia.com/en/lessons/ancova-in-r/ 이게 잘 되어 있는 듯해요.
다만 개념적으로 혼란을 막기 위해 https://www.lehigh.edu/~wh02/ancova.html 이 글을 참고해보시면 도움이 될 듯하옵니다.
구글링하셨다니 이미 보셨을 것 같기는 한데, https://www.datanovia.com/en/lessons/ancova-in-r/ 이게 잘 되어 있는 듯해요.
그리고 R을 배운다는 질문은 여러 가지로 해석할 수 있는데, 1) R에서 자료를 다루는 체계(자료구조)와 기초문법 등에 익숙해지시고 싶은 건지, 2) 원하는 분석 방법을 다루는 R 패키지를 다루는 법과 결과 해석에 익숙해지시고 싶은 건지로 나누어 볼 수 있을 듯해요. 하나 더하자면 3) 데이터 전처리나 시각화 등 분석과정/결과 보고에서 빼놓을 수 없는 과정?
선생님 목표가 무엇이냐에 따라 다를텐데 저는 1)부터 시작하는 걸 추천해요. 분석이 아니라 프로그래밍 언어로서의 R부터 시작하는 방식이요. 인터넷에 나와 있는 블로그 자료나 아무 R 설명 책을 쭉 훓어본 다음에 하시고 싶은 작은 프로젝트를 하나 잡아서 기능을 구현해보는 거예요. 시간은 오래걸리지만 검색하고 노트를 써가면서 하다보면 탄탄하게 익힐 수 있더라고요.
선생님 목표가 무엇이냐에 따라 다를텐데 저는 1)부터 시작하는 걸 추천해요. 분석이 아니라 프로그래밍 언어로서의 R부터 시작하는 방식이요. 인터넷에 나와 있는 블로그 자료나 아무 R 설명 책을 쭉 훓어본 다음에 하시고 싶은 작은 프로젝트를 하나 잡아서 기능을 구현해보는 거예요. 시간은 오래걸리지만 검색하고 노트를 써가면서 하다보면 탄탄하게 익힐 수 있더라고요.
목록 |
|