# Statistics
스터디노트 (통계학 2)
가설검정 = 가설(Hypothesis) + 검정(Testing)가설(Hypothesis) : 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측. 통계학에서는 특히 모수를 추정할 때 모수가 어떠하다는 증명하고 싶은 추측이나 주장귀무가설(Null hypothe
😢 스터디노트(통계학 1)
통계학 : 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야기술통계학 : 데이터를 수집하고 수집된 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론추론통계학 : 모집단으로부터 추출한 표본 데이
[Statistics]Degrees of Freedom(자유도)
Degrees of freedom : the number of independent values (pieces of information), which were included into calculation of an estimate→ 자유도의 정의는 estimate(

[Statistics]Bayesian to DPMM(2). Bayesian Approach & Hierachical model
오늘은 posterior distribution 에 대해서 조금 더 집중해서 글을 쓰려고 합니다.prior probability 와 posterior probability 의 사전적 정의는 다음과 같습니다.prior distribution : assumed probab
[Featured] P-value
What is p-value? It shows up many times while studying machine learning.
Sufficiency
이번 포스트에서는 통계학의 추정, 검정 등에서 중요하게 사용되는 통계량의 충분성에 대해 정리하고자 한다. 확률공간 $(\\Omega,\\mathcal{F},P)$ 을 이용해 random experiment를 정의할 때, 우리는 확률측도 $P$를 population이라고

정보 이론과 엔트로피
보통 엔트로피(Entropy)라 하면, 머릿속에 가장 먼저 떠오르는 것은 과학에서 다루는 열역학적 엔트로피이다. 열역학적 관점에서의 엔트로피는 "물체의 열적 상태를 나타내는 물리량의 하나"이다. 이러한 열역학적 정의는 차치하고, 통계학에서 정의하는 엔트로피에 대해 알

[Statistics]Bayesian to DPMM(1). Bayesian Approach
원래 git 에 자료들을 많이 올렸는데, 여기에 조금 더 가독성이 좋게 정리를 해보려고 합니다. 예전에 읽고 싶엇떤 논문이 dirichlet process mixture model 이라는 단어를 중심으로 전개되었습니다. dirichlet process mixture m

[하버드 확률론 기초 : Statistics 110] 5강- 조건부 확률과 전확률정리 (Conditioning Continued, Law of Total Probability)
본 포스트의 학습 내용은 boostcourse 내의 [하버드] 확률론 기초: Statistics 110 (Prof. Joe Blitzstein) 강의 내용을 바탕으로 작성되었습니다. (https://www.edwith.org/ai152)

[하버드 확률론 기초 : Statistics 110] 4강- 조건부 확률 (Conditional Probability)
본 포스트의 학습 내용은 boostcourse 내의 [하버드] 확률론 기초: Statistics 110 (Prof. Joe Blitzstein) 강의 내용을 바탕으로 작성되었습니다. (https://www.edwith.org/ai152)

[하버드 확률론 기초 : Statistics 110] 2강 - 해석을 통한 문제풀이 및 확률의 공리 (Story Proofs, Axioms of Probability)
본 포스트의 학습 내용은 boostcourse 내의 [하버드] 확률론 기초: Statistics 110 (Prof. Joe Blitzstein) 강의 내용을 바탕으로 작성되었습니다. (https://www.edwith.org/ai152)

[하버드 확률론 기초 : Statistics 110] 1강 - 확률과 셈 원리 (Probability and Counting)
본 포스트의 학습 내용은 boostcourse 내의 [하버드] 확률론 기초: Statistics 110 (Prof. Joe Blitzstein) 강의 내용을 바탕으로 작성되었습니다.
선형 회귀의 잠재적 문제
선형회귀모델을 다은과 같은 특정 자료에 적합할 때 많은 문제가 발생한다.1\. 반응변수-설명변수 상관관계의 비선형성2\. 오차항들의 상관성3\. 오차항의 상수가 아닌 분산4\. 이상치5\. 레버리지가 높은(영향력이 큰) 관측치6\. 공선성선형회귀모델의 기본 가정은 반응
선형판별분석 Linear Discriminant Analysis (작성중)
로지스틱 회귀(logistic regression)선형판별분석(linear discriminant analysis)K-최근접이웃(k-nearest neighbor hood)일반화가법모델(generalized additive model)트리(tree)랜덤포레스트(rand

04 분류 classification
분류기classifiers 질적 반응변수를 예측하는데 사용될 수 있는 분류기는 아래와 같은 기법이 있다. 로지스틱 회귀(logistic regression) 선형판별분석(linear discriminant analysis) K-최근접이웃(k-nearest neig
[확률통계] 확률론 기초 및 확률 분포
무작위성(Randomness)은 우리 주변에 있다.확률론(Probability)은 우연한 사건을 논리적으로 분석할 수 있게 한다.확률은 특정 사건이 발생할 것 같음을 숫자로 나타낸다.이 숫자는 0과 1 사이이다.0은 불확실함, 1은 확실함을 나타낸다.동전 던지기가 가장

Bayesian statistics overview
Basic concepts of bayesian statistics: prior, likelihood, and posterior