부록 D24: 수학적 생물모델링
이 장에서 배울 것
이번 장에서는 수학적 생물모델링(mathematical biology modeling)을 배웁니다. 생명 현상은 시간에 따라 변합니다. 세포 수가 늘고, 유전자 발현량이 오르내리고, 감염자가 늘다가 줄고, 단백질 농도가 변합니다. 이런 변화를 수학으로 표현하는 것이 생물모델링입니다.
핵심 용어를 먼저 정리하겠습니다.
- 모델(model): 현실을 단순화해 중요한 구조를 표현한 것입니다.
- 미분방정식(differential equation): 어떤 양의 변화율을 식으로 나타낸 것입니다.
- 확률모델(stochastic model): 우연성을 포함하는 모델입니다.
- 마르코프 사슬(Markov chain): 현재 상태만 보고 다음 상태의 확률을 정하는 모델입니다.
- 출생-사망 과정(birth-death process): 개체나 분자가 생기고 사라지는 과정을 나타내는 모델입니다.
- 개체군 동역학(population dynamics): 개체 수가 시간에 따라 어떻게 변하는지 보는 분야입니다.
- 유전자 조절 모델(gene regulatory model): 유전자들이 서로 켜고 끄는 관계를 수학적으로 나타낸 모델입니다.
- 시스템생물학 모델(systems biology model): 생물 시스템 전체의 연결과 변화를 함께 보는 모델입니다.
가장 쉬운 비유: 욕조 물 높이
욕조에 물이 들어오고 빠져나간다고 생각해 봅시다. 물 높이는 들어오는 물과 빠지는 물의 차이에 따라 변합니다. 세포 수, 단백질 농도, 감염자 수 변화도 비슷하게 볼 수 있습니다.
다음 양 = 현재 양 + 들어온 양 - 빠져나간 양
수학적 생물모델링은 이런 변화 규칙을 식으로 쓰고, 시간이 지나면 어떻게 될지 계산하는 작업입니다.
미분방정식의 직관
미분방정식은 현재 양이 얼마나 빠르게 변하는지를 나타냅니다. 예를 들어 세균 수가 많을수록 더 많이 늘어난다면 다음처럼 생각할 수 있습니다.
변화량은 현재 세균 수에 비례한다
입문 단계에서는 연속적인 미분방정식보다 한 단계씩 계산하는 이산 모델로 먼저 이해하면 됩니다.
다음 개수 = 현재 개수 + 증가량
증가량 = 증가율 × 현재 개수
지수 성장
세포나 세균이 일정 비율로 늘어나면 지수 성장처럼 보일 수 있습니다.
다음 수 = 현재 수 × (1 + 증가율)
예를 들어 현재 세균이 100개이고 증가율이 20%라면 다음 수는 100 × 1.2 = 120개입니다.
로지스틱 성장
현실에서는 자원이 무한하지 않습니다. 먹이, 공간, 산소가 부족해지면 성장이 느려집니다. 이를 반영한 단순 모델이 로지스틱 성장입니다.
다음 증가량 = 증가율 × 현재 수 × (1 - 현재 수 / 수용한계)
수용한계는 환경이 감당할 수 있는 최대 규모입니다. 현재 수가 수용한계에 가까워질수록 (1 - 현재 수 / 수용한계)가 작아져 성장이 느려집니다.
확률모델
세포 안 분자들은 적은 수로 존재할 때 우연의 영향을 크게 받습니다. 같은 조건에서도 어떤 세포는 유전자가 켜지고, 어떤 세포는 덜 켜질 수 있습니다. 확률모델은 이런 우연성을 포함합니다.
마르코프 사슬
마르코프 사슬은 현재 상태만 보고 다음 상태가 정해질 확률을 계산하는 모델입니다.
예를 들어 세포 상태가 A 또는 B라고 합시다.
A 상태 세포가 다음에 B가 될 확률 = 0.3
A 상태 세포가 그대로 A일 확률 = 0.7
현재 A 상태 세포가 100개라면, 다음에 B가 될 것으로 기대되는 세포는 100 × 0.3 = 30개입니다.
출생-사망 과정
출생-사망 과정은 무언가가 생기고 사라지는 모델입니다. 세포가 분열해서 늘어나는 것은 출생, 죽어서 줄어드는 것은 사망으로 볼 수 있습니다.
기대 변화량 = 출생 수 - 사망 수
예를 들어 세포가 20개 생기고 5개 죽으면 순증가는 15개입니다.
유전자 조절 모델
유전자 A가 유전자 B를 켜고, 유전자 B가 유전자 A를 억제한다면 단순한 직선 관계가 아니라 되먹임 구조가 생깁니다. 이런 구조는 세포 상태가 갑자기 바뀌거나, 안정적으로 유지되거나, 주기적으로 흔들리는 현상을 만들 수 있습니다.
계산 감각
이 장에서는 생명 현상을 시간 단계별로 계산합니다.
지수 성장: 다음 수 = 현재 수 × (1 + 증가율)
로지스틱 증가량 = 증가율 × 현재 수 × (1 - 현재 수 / 수용한계)
마르코프 기대값 = 현재 개수 × 전이 확률
순증가 = 생성량 - 소멸량
이 계산들은 복잡한 생명 현상을 아주 단순한 규칙으로 바꾸어 보는 첫걸음입니다.
생물정보학에서 왜 중요한가
수학적 생물모델링은 시스템생물학, 감염병 모델링, 종양 성장 모델, 유전자 조절망, 세포 운명 전이 분석에서 중요합니다. 데이터 분석이 “무엇이 보이는가”를 묻는다면, 모델링은 “왜 그렇게 변하는가”와 “앞으로 어떻게 변할까”를 묻습니다.
보강: 모델링은 식을 쓰기 전에 가정을 쓰는 일이다
수학적 생물모델링은 공식을 외우는 일이 아니라, 생명 현상을 어떤 규칙으로 단순화할지 정하는 일입니다. 좋은 모델링 흐름은 다음과 같습니다.
1. 알고 싶은 질문을 정한다.
2. 중요한 변수와 상태를 고른다.
3. 어떤 가정을 둘지 적는다.
4. 변화 규칙을 식이나 확률로 쓴다.
5. 파라미터를 데이터에서 추정한다.
6. 시뮬레이션으로 미래 변화를 계산한다.
7. 실제 데이터와 비교하고 모델을 고친다.
예를 들어 세포 증식 모델을 만들 때 “모든 세포가 같은 속도로 분열한다”고 가정할 수도 있고, “세포마다 분열 확률이 다르다”고 가정할 수도 있습니다. 어느 가정을 택하느냐에 따라 모델 결과가 달라집니다.
평형점과 안정성의 직관
평형점은 시간이 지나도 더 이상 크게 변하지 않는 상태입니다. 욕조 비유로 말하면 들어오는 물과 빠지는 물이 같아서 물 높이가 유지되는 상태입니다.
들어오는 양 > 빠지는 양 → 양이 증가
들어오는 양 < 빠지는 양 → 양이 감소
들어오는 양 = 빠지는 양 → 평형
생물학에서는 단백질 농도, 세포 수, 감염자 수가 어떤 수준 근처에서 유지될 수 있습니다. 안정한 평형은 조금 흔들려도 다시 돌아오는 상태이고, 불안정한 평형은 조금만 흔들려도 멀어지는 상태입니다.
결정론 모델과 확률모델
결정론 모델은 같은 시작값과 같은 파라미터를 넣으면 항상 같은 결과가 나옵니다. 확률모델은 같은 조건에서도 매번 조금 다른 결과가 나올 수 있습니다.
결정론 모델: 평균적인 흐름을 보기 좋다.
확률모델: 세포 수나 분자 수가 적어 우연성이 클 때 중요하다.
단일세포 수준에서는 같은 유전자 회로라도 어떤 세포는 켜지고 어떤 세포는 꺼질 수 있습니다. 이런 현상을 이해하려면 확률모델이 필요합니다. 모델은 현실을 단순화하지만, 어떤 단순화가 결론에 영향을 주는지 항상 점검해야 합니다.
보강 학습: 수학적 생물모델링과 count model 연결
왜 필요한가: 시간 변화, 성장, 포화, count 변동을 명시적으로 모델링하기 위해 필요합니다.
공식 읽기: N(t+1)=rN(t). N(t)는 시간 t의 세포 수, r은 한 단계 뒤 몇 배가 되는지 나타내는 성장 계수입니다.
숫자 예시: N(0)=100, r=1.5이면 N(1)=150, N(2)=225입니다.
생물정보학에서 쓰이는 장면: 세포 성장, 감염 확산, 약물 반응, RNA-seq count model의 평균·분산 해석에 쓰입니다.
흔한 오해와 주의점: 복잡한 모델이 항상 좋은 모델은 아닙니다. 데이터량, 질문, 파라미터 해석 가능성에 맞는 복잡도가 필요합니다.
핵심 정리
수학적 생물모델링은 시간에 따라 변하는 생명 현상을 식과 확률로 표현하는 방법입니다. 지수 성장, 로지스틱 성장, 마르코프 사슬, 출생-사망 과정은 모두 복잡한 생명 현상을 단순한 계산 규칙으로 이해하게 해 줍니다. 모델은 현실을 완벽히 복사하지 않지만, 중요한 구조를 생각하게 만드는 도구입니다.
문제 풀이
수학적 생물모델링
주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.
-
1. [쉬움] 객관식
수학적 생물모델링의 설명으로 가장 적절한 것은?
-
2. [쉬움] 객관식
모델(model)의 의미로 적절한 것은?
-
3. [보통] 객관식
마르코프 사슬의 직관으로 적절한 것은?
-
4. [계산] 객관식
현재 세균 100개, 증가율 20%이면 다음 수는?
-
5. [계산] 객관식
현재 세포 50개, 증가율 10%이면 다음 수는?
-
6. [계산] 객관식
세포가 20개 생기고 5개 죽으면 순증가는?
-
7. [계산] 객관식
A 상태 세포 100개가 B로 갈 확률이 0.3이면 기대되는 B 전이 세포 수는?
-
8. [계산] 객관식
현재 수 100, 증가율 0.2, 수용한계 200일 때 로지스틱 증가량은?
-
9. [계산] 객관식
현재 수 50, 증가율 0.1, 수용한계 100일 때 로지스틱 증가량은?
-
10. [보통] 객관식
확률모델이 필요한 이유로 적절한 것은?
-
11. [계산] 객관식
출생-사망 과정에서 출생 8, 사망 3이면 기대 변화량은?
-
12. [보통] 객관식
로지스틱 성장에서 현재 수가 수용한계에 가까워질수록 성장은?
-
13. [계산] 객관식
현재 200개, 증가율 5%이면 다음 수는?
-
14. [계산] 객관식
상태 A 40개가 B로 갈 확률 0.25이면 기대 전이 수는?
-
15. [계산] 객관식
생성량 12, 소멸량 12이면 순증가는?
-
16. [계산] 객관식
현재 수 80, 증가율 0.5, 수용한계 100일 때 로지스틱 증가량은?
-
17. [계산] 객관식
현재 수 10, 증가율 100%이면 다음 수는?
-
18. [계산] 객관식
A 상태 60개 중 그대로 A일 확률이 0.7이면 그대로 남을 기대 수는?
-
19. [계산] 객관식
출생 30, 사망 10이면 순증가는?
-
20. [계산] 객관식
현재 수 100, 증가율 0.1, 수용한계 100이면 로지스틱 증가량은?
-
21. [보통] 객관식
미분방정식의 직관으로 적절한 것은?
-
22. [보통] 객관식
시스템생물학 모델이 보려는 것은?
-
23. [보통] 객관식
모델을 현실의 완벽한 복사본으로 보면 안 되는 이유는?
-
24. [보통] 객관식
유전자 조절 모델에서 되먹임 구조가 중요한 이유는?
-
25. [계산] 객관식
현재 세포 수 100, 증가율 0.20인 지수 성장에서 다음 세포 수는?
-
26. [계산] 객관식
출생 30, 사망 12일 때 순증가는?
-
27. [계산] 객관식
현재 A 상태 세포 200개가 B로 갈 확률이 0.25라면, 다음에 B로 갈 기대 세포 수는?
-
28. [계산] 객관식
로지스틱 증가량이 r×N×(1-N/K)이고 r=0.5, N=40, K=100이면 증가량은?
-
29. [계산] 객관식
현재 단백질 농도 50, 생성 15, 분해 5라면 다음 단계 농도는?
-
30. [계산] 객관식
감염자 수가 매일 10%씩 늘고 현재 200명이라면 하루 뒤 예상 감염자 수는?
-
31. [개념 구분] 객관식
결정론 모델의 특징으로 가장 적절한 것은?
-
32. [사례 판단] 객관식
세포 안 분자 수가 매우 적어 같은 조건에서도 세포마다 유전자 발현이 달라진다. 더 적합한 모델 관점은?
-
33. [보통] 객관식
N(t+1)=rN(t), N(0)=100, r=1.5일 때 N(2)는? -
34. [보통] 객관식
logistic growth가 필요한 이유는?
-
35. [쉬움] 객관식
모델 파라미터란?
-
36. [어려움] 객관식
negative binomial이 count model에서 유용한 이유는?
-
37. [어려움] 객관식
복잡한 모델에 대한 올바른 태도는?
-
주관식 38. [보통] 주관식 · Gemini 채점
수학적 생물모델링이 무엇인지 욕조 비유를 사용해 설명하라.
-
주관식 39. [보통] 주관식 · Gemini 채점
지수 성장과 로지스틱 성장의 차이를 설명하라.
-
주관식 40. [보통] 주관식 · Gemini 채점
확률모델이 생물학에서 필요한 이유를 설명하라.
-
주관식 41. [보통] 주관식 · Gemini 채점
모델이 현실을 완벽히 복사하지 않아도 유용한 이유를 설명하라.
-
주관식 42. [심화] 주관식 · Gemini 채점
수학적 생물모델링에서 식을 세우기 전에 가정을 명확히 적어야 하는 이유를 설명하라.
-
주관식 43. [보통] 주관식 · Gemini 채점
N(t+1)=2N(t), N(0)=30일 때 N(3)을 계산하라. -
주관식 44. [보통] 주관식 · Gemini 채점
단순 지수성장 모델이 실제 세포 성장 데이터를 항상 잘 설명하지 못하는 이유를 설명하라.