개요
종속성 고려 알고리즘 제안
조건부 독립 모델은 각 에 대한 여러 라벨 함수 출력을 연결하는 고차 요소를 포함하여 추가 종속성이 있는 factor graph 로 일반화 하겠다.
제시한 일반 모델의 형태는 아래와 같음
: 관심 있는 종속성 유형의 집합 = {표준 종속성, 결합 종속성}
유형의 각 종속성 유형에 참여하는 label functions의 index number 집합
종속성 정의
1.표준 상관 종속성
2.결합 종속성
더 많은 변수를 포함하는 고차 종속성 고려
의 구조를 추정하는 것은 Y가 latent value 이므로 어려움(train 중에도 관측 값으로 사용하지 않으므로 → 즉, ground truth가 없는 상태로 학습한다는 것)
따라서 marginal likelihood 을 구함, 또한 생성 모델의 매개 변수를 공동으로 학습하기 위해 Gibbs 샘플링 이용 → 결합 분포는 복잡하지만 완전 조건부 분포(Full conditional posterior distribution)를 구하기 쉬운 형태로 주어지는 경우 Gibbs 샘플링을 적용하기 용이
Gibbs 샘플링에 대한 간단한 설명
목표 함수 최적화 문제를 pseudolikelihood 형태로 나타내면 아래의 식을 최소화 하는 를 찾는 문제로 변환
pseudolikelihood 정의
pseudolikelihood 식에 정규화 항 추가
위 식을 아래와 같이 전개하면
위의 각 항 에 대하여 아래의 기울기 계산 가능
,
각 라벨 함수 에 대해 차례로 최적화하여 충분히 큰 매개변수가 있는 종속성을 선택하고 이를 추정된 구조에 추가하는 알고리즘을 수행
알고리즘
notation
- Input
- : 관측 값
- : threshold
- 파라미터 를 갖는 확률 분포 , 초기 파라미터는
- : epoch size
- : step size
- : truncation frequency
- Output
- :