AI 부트캠프 | Week 1 (#수학이론, #통계)

Gomcha ·2023년 7월 23일
0

FC AI 6기 부트캠프

목록 보기
1/13
post-thumbnail

0.목차

1. Set Theory(집합)
2. Mathematical Statement(명제)
3. Functions(함수)
4. Probabilities and Random Variables(확률과 확률변수)
5. Binomial Theorem(이항정리)
6. Exponential(지수함수, 로그함수)
7. Distributions(분포)
8. Sample Distribution(표본분포)
9. Examples of Sample Distributions(표본분포의 예)
10. Sequences and Limit(수열과 극한)
11. CLT and LLN(중심극한정리, 큰 수의 법칙)
12. Hypothesis Test(가설검정)
13. ANOVA
14. Linear Algebra(선형대수)
15. Convexity(볼록성)
16. Regression(회귀분석)

1.집합

  • 정의 : 어떤 특정 조건을 만족하는 멤버들의 조합
    - 원소 : 집합에 주어진 멤버
    eg. a∈A 는 '집합A는 원소a를 포함한다.'라고 함

  • 집합 내 원소 표기 방법
    - ①원소나열법, ②조건제시법

  • A, B 집합
    - A⊂B 'A는 B의 부분집합이다.' 라고 하며, A의 모든 원소는 B에 포함된다.
    - A=B 'A와 B는 동일하다.'라고 하며 A⊂B 그리고 B⊂A이다. 이를 Double inclusion이라고 한다.

  • ϕ 공집한
    - 원소를 가지지 않는 집합이다.

  • X가 집합이고, A,B⊂X가 주어졌다.
    - A∪B := {x∈X : x∈A or x∈B} : union
    - A∩B := {x∈X : x∈A and x∈B} : intersection
    - AXB := {(a,b) : a∈A, b∈B} : cortesian product ⇒ 파이썬의 튜플 형태

2.명제

  • 정의 : 참이거나 거짓인 문장

  • 논리 기호
    - ∀ : 모두
    - ∃ : 일부, 존재

  • p(가정), g(결론) 명제가 있다.
    - p⋀q : and
    - p⋁q : or
    - ㄱp : not
    - p→q : 가정이 거짓일 때, 결과와 관계없이 참이며, 가정이 참일 때는 결론이 참일때만 참

  • 필요조건과 충분조건
    - p→q가 참이라고 하자.
    - p는 q의 충분조건
    - q는 p의 필요조건
    - p→q이고 q→p일 때, 필요충분조건이라고 한다. "P=Q, 동치"

3.함수

  • A, B : 집합
    * 순서쌍 집합 R은 AXB의 부분집합이다.

  • A, B : 집합
    f⊂AXB는 A에서 B로 가는 함수이다.
    각각의 x∈A는 유니크한 원소로 y∈B 존재한다. (x, y)∈f이다.
    * A는 domain(정의역), B는 codomain(공역), f(A) := {f(x) : x∈A}는 치역(range or image)

  • f : A→B 함수
    - 일대일 함수(one to one/injective)
    - onto/ surjective
    - 일대일 대응(bijective)

  • f: A→B bijective
    - 함수 f⁻¹ : B→A는 f⁻¹(y)=x에 의해, y=f(x)이다. 이를 역함수라고 부른다.

4.확률과 확률변수

  • 표본공간(sample space) : 모든 관찰 데이터에 대한 전체 집합
    - 사건(event) : 모든 space의 부분집합

  • S : smple space일 때, 확률 P는 다음을 함수를 만족한다.
    - 1) ∀event A on S일 때, P(A)는 0과 1 사이에 있다.
    - 2) P(S)=1
    - 3) A1, A2,... : Ai∩Aj = ϕ이다.
    ⇒ P(A1∪A2...)=P(A1)+P(A2)+...

  • 실수가치 함수 X : S→R는 확률변수라고 한다. 모든 실험의 결과가 범위로 존재한다.
    - X는 이산확률변수일 때, X(S)는 셀수 있다. (넘버링을 할 수 있다.)
    - X는 연속확률변수일 때, X(S)는 셀수 없다.

  • X : random variabel일 때, P(a≤X≤b) :=P(X⁻¹([a,b])), P(X=x):= P(X⁻¹(x))
    - X : 이산적일 때, 함수를 확률밀도함수라고 한다.
    - X : 연속적일 때, 함수를 확률밀도함수라고 한다.
    ⇒ P(a≤X≤b)는 확률분포라고 한다.

7.분포

  • 이항분포 : 성공과 실패같은 사상에 대한 분포
    - 베르누이 분포 : 결과가 두 종류밖에 없는 실행

  • 다항분포 : 성공과 실패가 아닌 여러 경우를 고려하는 분포

  • 정규분포: 평균과 표준편차가 주어져 있을 때, 엔트로피를 최대화하는 분포

  • 포아송분포 : 희구하게 발생하는 건수에 대해 모델링 하고 싶을 때 사용되는 분포

8, 9.표본분포

  • 모집단과 샘플링
    - 모집단
    - 샘플링 : 복원추출/비복원추출

  • X1,...,X2 : idd

  • 카이분포 : k개의 서로 독립적인 표준정규확률 변수를 각각 제곱한 다음 합해서 얻어지는 분포(

  • t-분포 : 모집단 표준편차를 알 수 없을 때, 표본평균과 모집단 평균 사이 표준화된 거리를 설명함(모집단의 평균을 측정할 때 사용)

  • F-분포 : 정규분포를 이루는 모집단에서 독립적으로 추출한 표본들의 분산비율이 나타내는 연속확률분포(두 모집단의 분산의 비를 추론할 때 사용)

12.가설검정

  • 기각하고 싶은 가설 : 귀무가설

  • 채택하고 싶은 가설 : 대립가설

    	※ 주의 ※ 

    1) 귀무가설을 기각하지 못했다고 해서 채택X, 단지 기각할 근거가 부족했을 뿐임
    2) "변함없음"을 채택하고 싶은 경우, "크게 다르지 않다"로 우회하여 대립가설을 설정한다.

  • 기각역 : 귀무가설이 기각, 대립가설이 채택되는 검정통량의 영역(유의수준에 의해 결정됨)

  • 유의수준 : 귀무가설 True임에도 이를 기각할 확률

profile
공부하는 데이터 분석가 👩‍💻

1개의 댓글

comment-user-thumbnail
2023년 7월 23일

개발자로서 성장하는 데 큰 도움이 된 글이었습니다. 감사합니다.

답글 달기