Biostatistics 통계 분석- 일반 선형 모델 GLM 확장 (General Linear model, Generalized Linear model, Generalized Estimating Equations)

Hoya Jaeho Lee·2022년 3월 12일
0

Biostatistics

목록 보기
9/20

선형 회귀 분석(Linear Regression Model)의 특징

-결과 변수가 연속형 변수에 한정되어있고 정규 분포 가정을 따른다

GLM(General Linear Model,일반 선형 모델)과 GLM(Generalized Linear Model,일반화 선형 모델)

-일반 선형 모형(General Linear Model)은 종속변수와 독립변수가 모두 연속변수인 분산 분석(ANOVA,ANCOVA,MANOVA,MANCOVA등) 아우르는 종합적인 버젼
모델을 구하는 수학적 방식은 : 우리가 흔히 알고 있는 선형모델에서 계수 추정을 활용하는 Least squares method

-일반화 선형 모형(Generalized Linear Model)은 Link function에 종속변수의 변환과(로짓,로그,프로빗등) 종속변수의 분포도 사용자 정의(이항검정,감마,포아송,다항 등등)에 의해 설정한다. Maximum Likelihood(최대우도)를 활용하여 모수를 추정하는 방법이다. 종속변수가 정규 분포를 따르지 않을 때 이용가능한 방법:)

다시 정리하자면, 일반화 선형 모델은 종속변수의 분산이 평균에 따라 달라져서 정규적인 분포의 형태를 이루지 않거나 종속변수의 구간이 제한적이어서 변환을 거쳐야 하는 경우 선형성과 등분산성을 향상시키기 위하여 선형 모형 대신 일반화(Generalized) 선형 모델을 적용한다.

Generalized Estimating Equations (일반화 추정 방정식,GEE)

-피험자 그룹에 반복측정 상황(여러 개체를 여러 시점에서 반복 측정, 패널 자료)에서 반응과 공변량을 측정한 결과를 볼 때 기울기와 공변량을 구하는 것이 목표:) 결과 변수가 양분(dichotomous)되었거나 categorical 한 경우 그리고 연속형 변수일 때 사용가능

GEE는 GLM이 상관이 있을 때 그 자료를 분석하기 위해서 확장한 모형이다. Quasi-likehood estimation를 사용하여 분석:)
일반적인 선형회귀 분석(OLS)에서는 잔차의 correlatioln이 0인데,
GEE는 잔차의 correlation에서 교호 작용이 있다는 전제 하에 분석 모형

-GEE의 큰 핵심 아이디어는 모든 피험자에 대해 평균을 내고 대상 내 공분산 구조를 잘 예측:)
데이터가 특정 분포에서 생성되었다고 가정의 대신에
공변량과 반응 사이의 관계를 설명하기 위해
반복적으로 최선의 계수를 선택하기 위해 모멘트 가정을 사용

References
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=jae_won8716&logNo=220836076705
https://dogmas.tistory.com/entry/%EC%9D%BC%EB%B0%98%EC%84%A0%ED%98%95%EB%AA%A8%EB%8D%B8-General-Linear-Model-GLM-SPSS-%EC%82%AC%EC%9A%A9%EC%84%A4%EB%AA%85%EC%84%9C-21
https://statmath.wu.ac.at/courses/heather_turner/glmCourse_001.pdf
https://m.blog.naver.com/shoutjoy/221967163188
https://elecs.tistory.com/348

profile
Biostatistics researcher Github: https://github.com/hoyajhl

0개의 댓글