※ 단순한 메모를 옮겨 놓은 글로, 정리가 부정확할 수 있습니다.

원 글 작성일 : 2020-08-23

관련 연구

1. Nowcasting and forecasting the potential domestic and international spread of the 2019-nCoV outbreak originating in Wuhan, China: a modelling study

Paper : Nowcasting and forecasting the potential domestic and international spread of the 2019-nCoV outbreak originating in Wuhan, China: a modelling study

Method
SARS-CoV를 기반으로 한 Serial interval estimate(세대 기간-첫 감염병 발생자의 증상 발병시기와, 2차 감염자의 증상 발병 시기 사이의 시간차이) SEIR모델이 쓰였고, The basic reproductive number(기초 재생산 지수)는 Markov Chain method을 이용하여 추정하였고, Resulting posterior mean(결과 사후 추정)와, 95% credible interval (95%의 신용 구간)을 이용하여 제시되었다.

  • 기본적으로 어떤 결과를 추정하고 싶을 때, P(사건I현상)을 알아야한다(posterior).
  • 하지만 이러한 확률은 알기 힘들기 때문에 P(현상I사건)으로 근사하는 방법을 택한다-(likelihood).

2. Novel coronavirus 2019-nCoV: early estimation of epidemiological parametersandepidemic predictions

Paper: Novel coronavirus 2019-nCoV: early estimation of epidemiological parametersandepidemic predictions

Method
초기 발생의 기초재생산지수를 3.11로 하여 (95%로 추정, 구간 : 2.39~4.13) 최종 감염병 수준을 예측했고, 이는 ★푸아송분포를 통해 예측하였다.

3. Estimation of the Transmission Risk of the 2019-nCoV and Its Implication for Public Health Interventions

Paper: Estimation of the Transmission Risk of the 2019-nCoV and Its Implication for Public Health Interventions

Method
clinical progression of the disease, individual epidemiological status, 그리고 intervention measure 를 모델에 통합시켰다.

  • 그 결과, 강한 개입 정책(격리와 고립 같은)은 효과적으로 감염 재생산지수와 전염위험을 낮춘다는 것을 시사한다.

4. Imperial College London의 Imai 교수의 컴퓨터 모델링

https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/covid-19/covid-19-publications/

  • 추후 참고

5. Substantial undocumented infection facilitates the rapid dissemination of novel coronavirus (SARS-CoV2).

Paper: Substantial undocumented infection facilitates the rapid dissemination of novel coronavirus

Method: meta-population SEIR모델과 ★Bayesian inference 을 이용한 추론
Conclusion: 약 86%의 감염이(1월23일 이전)이 공식화(서류화) 되지 않았다고 예상된다.

★관측되지 않은 확진자 (혹은 확진 후 완치자) 에 대한 매개변수는 어떻게 설정할 것인지.

기타 메모

Bayesian inference

  • 추론 대상의 사전 확률과 추가적인 정보를 통해 해당 대상의 사후 확률을 추론하는방법
  • 통계학(특히, mathematical statistics)에서는 굉장히 중요한 테크닉이다.

ETC

그 외에도 수 많은 논문들과 모델들이 있지만, 중요한 부분은 mathematical model과 numerical simulations (수치적 시뮬레이션), data validation(데이터 유효성 검사), 그리고 statistical techniques(통계적 테크닉)등을 결합해 연구를 진행한다는 것이다. 이러한 연구들은 분명히 COVID-19와 관련해 넓은 범위의 전염특성을 다루었고, 복잡한 전염방식(transmission mechanism)에 대한 이해를 높혔지만, 분명히 현재 모델링 연구들에는 한계가 있다.

Limitations

대 부분의 연구는 Basic SEIR을 기반으로 한다.

이는 인간-인간의 직접적인 경로만 고려한 모델이며, 세간에도 무증상이든 증상이든 타인과의 직접적인 접촉을 통해서 감염이 된다고 알려져 있다. 다만, 환경을 통한 간접적인 전염 경로도 마찬가지로 가능성이 높으나, 충분히 연구에서 다뤄지지 않았다

실제로, 이번 파주 스타벅스에서도 에어컨을 통한 비 접촉 감염이 현실화 되었다.
이럴 때는 슈퍼 전파자 1명이 기존 R0값을 초과하여 감염시키는 결과가 나오곤 한다.
또한, 이 논문에서 말하는 ‘환경을 통한 감염’은 metal,glass,plastic cup 등에 존재하는 바이러스를 통한 감염을 얘기한다.(최대 9일까지 바이러스 생존가능)
aerosol(공기)에도 최대 3시간까지 존재함을 관측할 수 있었고, copper(구리)에는 4시간, caradboard(판지)에는 최대 24시간, plastic과 stainless steel에는 최대 3일까지 존재함이 관측되었다. 이러한 연구결과는 COVID-19의 환경 감염(공기 오염 or 물질 오염) 높은 가능성을 암시하곤 한다.
즉, 이러한 환경-인간 간의 감염 루트를 모델링에 통합시켜야, 엄밀한 전염병 동역학에 도움이 될 것

covid-19의 전염병 모델은 전염률(transmission rated)를 보통 상수로 고정한다.

이는 mathematical analysis와 data fitting의 간단함을 위해 렌더링한 것이다. 하지만 관습적으로 전염률은 사회경제적 상태에 따라 달라지며, outbreak control으로부터 영향도 받는다.
예를 들면, 전염병이 만연한 상황에서 사람들은 자기 자신과 가족들을 지키기 위해 자발적으로 감염 된 사람과의 접촉을 줄이거나, 전염 가능성이 있는 환경에의 접근을 줄이는 등 자발적인 노력을 기울이기 때문에 전염률은 낮을 것이며, 낮은 발병률의 시기엔 오히려 전염률이 높다고 볼 수 있다 (억제정책의 스트레스로 인한 보상심리, 방심 등 때문에)

  • 전염률의 특성에 의존하는 이러한 유행 시기에 대한 반영도 수리적 모델의 정확도에 도움을 줄 것

중간 결론

즉, 지금까지는 현재 전염병컨트롤에 관해서 주로 행해지는 토론은 “suppression”과 “mitigation” 사이에서 행해진다고 봤을 때 “suppression policy”(억제 정책-주로 중국과 몇 나라에서 행해지는)은 분명히 감염률을 줄이고, 감염병을 통제 할 수 있으나 동시에 억제의 기간동안 경제 발전의 기회비용을 희생시켜서 얻은 결과일 것이다. 반면에 “mitigation policy”(완화 정책-주로 미국과 몇 몇 유럽 국가에서 행해지는)은 감염 곡선의 억제와 유지(Flatten)와 집단면역의 확립을 목표로 하는 느슨한 정책을 채택해 어느정도 경제 성장을 보장하는 차이점이 있다.

수리적인 전염병 모델은 분명히 전염병-경제적인 요소의 상호적인 영향을 정량화하고,이상적인 전염병 억제와 경제발전의 이상적인 균형을 찾아 제안함으로써 모델에 covid-19의 경제적인 영향을 통합시키기에 좋은 위치를 갖고 있다. 이러한 관점에서, combined epidemic-economic 모델링 환경은 정부와 국민보건행정의 전략 계획과 정책 수립에 도움이 될 것이라고 사료된다.

즉 이를 위해서는 더욱 많은 factor를 추가해야 하는데, 이를 인공지능과 결부 지어서 생각할 수 있을지 따져봐야 한다. (약간 다른 분야지만, 이번 AI분야의 GPT-3알고리즘은 이러한 parameter만 1750억개를 갖췄다고 한다)

현재는 COVID-19에 대해 생태학적, 유전적, 미생물적, 병리학적인 세부사항들이 잘 안 알려져있어, 수리적 모델링에 어려움(challenge)을 더한다. 또한 수리적 모델에 나타내기 힘들지만 고려해야할 정치,사회부터 문화,윤리적인 규범까지 존재한다. 즉 수리적 모델링은, 그 자체만으로는 그저 현실의 단순화와 근사화에 그친다는 것을 인정하고 발전시키려 노력해야한다. (응용 수학자, 의학연구자,공공보건과학자 등)

다만, 굉장히 복잡하고 정교한 모델이 실용적인 관점에선 잠재적으로 쓸모있는 건 맞지만, 모델의 복잡성 증가는 필연적으로 분석, 조작, 시행의 어려움을 동반하며 이는 간단한 모델인 SEIR모델을 사용하는 장점이 모두 없앨 것. 그렇지만 수리적 모델은 기본적인 가정 및 조건을 갖고 있다는 걸 주목하면, 이러한 것들의 구조와 복잡도에 상관없이, 모델은 절대 가정(assumptions)보다 잘 작동할 수는 없다.

더 진보된 모델링을 위한 바람직한 방향은 data-driven techniques(특히, 머신러닝)를 모델링에 결부 짓는 것이라고 볼 수 있을 것 같다.
또한, 이러한 AI테크닉이 주가 되며, 수리적 모델은 이러한 머신 러닝 예측을 정당화하고 동시에 머신 러닝과 데이터 분석에 쓰이는 알고리즘의 효율적이고 건강한 발전에 가이드라인을 제공한다고 보면 된다.

즉, 이러한 두가지의 다른 정량적 접근(여기서는 머신 러닝과 수리적모델)은 상호적으로 도움이 되며 이러한 접근법들의 통합은 분명히 모델링의 정교화에 도움이 될 것.

이러한 수리적 모델도 분명히 중요하지만, 전염병 모델의 발전과 적용에 있어서 우리는 중요한 모델링 가정의 검증과, 모델과 현실데이터의 연결, 실용적인 필요성에 알맞는 모델 재단(설계)와 분석-컴퓨터 테크닉의 도움을 활용하는 것도 중요하다는 것을 알아두자.

내 모델링의 목적은, 미래 예측도 예측이지만 그 보다는 지금까지 생긴 데이터를 고려 하여 모델의 정교하게 만드는데 중점을 두고있는데 데이터가 많아짐에 따라 머신러닝기법등을 사용하면 조금 더 정확하게 학습될 것이라고 사료된다.
다만, 머신러닝을 이용했을 때 나오게 된 결과에 대해 스스로도 납득을 하고 싶은데, 머신러닝같은 경우 블랙박스(머신러닝은 잘 작동하지만, 결과가 왜 그렇게 나왔는지 알지 못하는 상태)로도 자주 불릴 정도로 판단에 대한 근거를 알 지 못하는 경우가 많다.

그런 이유 때문에, 미래엔, 설명가능 인공지능에 조금 더 관심을 두고, 이를 추후 연구에 적용하고 싶다.

0개의 댓글