5 분 소요

이 장에서 배울 것

이 장에서는 생명체가 세대를 거치며 어떻게 변하는지 배웁니다. 이 과정을 진화(evolution)라고 합니다. 생물정보학에서 진화는 단순한 교양 지식이 아닙니다. 서열 비교, 단백질 기능 예측, 계통분석, 보존서열 분석의 바탕입니다.

먼저 용어를 정리합니다.

  • 자연선택(natural selection): 환경에 더 잘 맞는 특징을 가진 개체가 더 많이 살아남고 번식하는 과정입니다.
  • 돌연변이(mutation): DNA 서열에 생기는 변화입니다.
  • 유전적 부동(genetic drift): 우연 때문에 대립유전자 빈도가 변하는 현상입니다.
  • 적응(adaptation): 환경에 더 잘 맞도록 형질이 변화한 결과입니다.
  • 계통수(phylogenetic tree): 생명체들의 진화적 관계를 나무 모양으로 표현한 그림입니다.
  • 보존서열(conserved sequence): 진화적으로 오래 유지된 DNA나 단백질 서열입니다.

진화와 서열 보존

가장 쉬운 비유: 여러 판본의 책을 비교해 원본과 중요한 문장을 추정하기

아주 오래된 책이 여러 지역으로 퍼져 손으로 베껴졌다고 합시다. 시간이 지나며 오타도 생기고, 어떤 문장은 바뀌고, 어떤 문장은 거의 그대로 남습니다. 여러 판본을 비교하면 어떤 판본들이 가까운 친척인지, 어떤 문장이 오래전부터 중요해서 잘 보존되었는지 추정할 수 있습니다.

DNA와 단백질 서열 비교도 비슷합니다. 여러 생물의 서열을 비교하면 공통조상의 흔적, 기능적으로 중요한 구간, 진화적 관계를 추정할 수 있습니다.

진화는 개체 하나가 변신하는 일이 아닙니다

초보자가 자주 오해하는 부분입니다. 진화는 한 개체가 살아 있는 동안 갑자기 다른 종으로 변하는 일이 아닙니다. 진화는 세대를 거치며 집단의 유전적 구성이 달라지는 과정입니다.

예를 들어 어떤 세균 집단 안에 항생제(세균을 죽이거나 자라지 못하게 하는 약)에 조금 더 잘 버티는 변이가 있다고 합시다. 항생제를 쓰면 그 변이를 가진 세균이 더 많이 살아남고 번식할 수 있습니다. 시간이 지나면 집단 안에서 그 변이가 늘어날 수 있습니다. 이것이 진화적 변화입니다.

진화의 재료: 돌연변이와 유전적 변이

진화가 일어나려면 차이가 있어야 합니다. 모든 개체가 완전히 같다면 선택될 차이도 없습니다. DNA 변화인 돌연변이는 새로운 유전적 차이를 만드는 중요한 원천입니다.

하지만 돌연변이가 곧바로 좋은 변화라는 뜻은 아닙니다. 대부분은 영향이 작거나 없을 수 있고, 일부는 해롭고, 아주 일부는 특정 환경에서 유리할 수 있습니다.

자연선택과 유전적 부동

자연선택은 환경에 더 잘 맞는 특징이 다음 세대에 더 많이 남는 과정입니다. 항생제 내성, 병원체의 면역 회피(몸의 방어 체계를 피해 살아남는 능력), 특정 환경에 적응한 효소 기능 등이 자연선택과 연결될 수 있습니다.

유전적 부동은 우연 때문에 대립유전자 빈도가 변하는 현상입니다. 특히 집단 크기가 작을 때 우연의 영향이 큽니다. 어떤 변이가 특별히 유리하지 않아도 우연히 늘거나 사라질 수 있습니다.

이 두 과정을 구분하는 것이 중요합니다. 모든 변화가 “적응” 때문은 아닙니다. 어떤 변화는 선택의 결과이고, 어떤 변화는 우연의 결과일 수 있습니다.

계통수: 생명체의 친척 관계 그리기

계통수는 생물 사이의 진화적 관계를 나무처럼 나타낸 그림입니다. 가지가 가까우면 비교적 최근에 공통조상을 공유했을 가능성이 큽니다.

계통수는 종 사이 관계뿐 아니라 바이러스 변이 추적, 단백질 가족 분석, 유전자 중복 연구에도 쓰입니다. 감염병 유전체 분석에서 바이러스가 어떻게 퍼지고 변했는지 추적하는 데도 계통 분석이 중요합니다.

보존서열이 중요한 이유

여러 종을 비교했는데 어떤 DNA나 단백질 구간이 오랫동안 거의 바뀌지 않았다면, 그 구간은 기능적으로 중요할 가능성이 있습니다. 중요한 부분이 크게 바뀌면 생존에 불리할 수 있기 때문에 진화 과정에서 보존되는 경우가 많습니다.

단백질에서 보존된 아미노산은 구조나 기능에 중요할 수 있습니다. DNA에서 보존된 비암호화 구간은 유전자 조절에 관련될 수 있습니다.

생물정보학에서 진화가 쓰이는 곳

서열 정렬은 DNA나 단백질 서열을 나란히 놓고 비슷한 위치를 맞추는 작업입니다. 이 작업은 진화적으로 같은 기원을 가진 위치를 비교하려는 시도입니다.

기능 예측도 진화 정보를 사용합니다. 어떤 미지의 단백질이 이미 기능이 알려진 단백질과 매우 비슷하다면, 비슷한 기능을 가질 가능성이 있습니다.

계통분석은 종, 유전자, 바이러스 변이의 관계를 추정합니다. 보존서열 분석은 기능적으로 중요한 구간을 찾는 데 도움을 줍니다.

보강 학습: 서열 비교에서 진화를 읽는 법

진화생물학은 “옛날 생물 이야기를 외우는 과목”이 아닙니다. 생물정보학에서는 DNA와 단백질 서열을 비교할 때 거의 항상 진화적 사고가 들어갑니다. 두 서열이 비슷하다는 말은 단순히 글자가 비슷하다는 뜻을 넘어서, 공통조상에서 물려받은 흔적일 가능성을 생각하게 합니다.

여기서 중요한 구분이 있습니다. 유사성(similarity)은 현재 보이는 서열이 얼마나 비슷한지를 뜻합니다. 반면 상동성(homology)은 두 서열이 공통조상에서 왔다는 진화적 관계를 뜻합니다. 유사성은 숫자로 “90% 비슷하다”처럼 말할 수 있지만, 상동성은 원칙적으로 “상동이다/아니다”에 가깝습니다. 초보자가 흔히 “80% 상동성”이라고 말하는데, 더 정확하게는 “80% 서열 유사성을 보이며 상동일 가능성이 높다”라고 표현하는 편이 좋습니다.

상동 유전자도 다시 나눌 수 있습니다. ortholog는 종이 갈라지면서 나뉜 상동 유전자입니다. 예를 들어 사람과 생쥐가 공통조상에서 갈라진 뒤 각각에 남은 비슷한 유전자는 ortholog일 수 있습니다. 반면 paralog는 한 생물 안에서 유전자 중복으로 생긴 상동 유전자입니다. 기능 예측에서는 ortholog가 특히 중요합니다. 서로 다른 종의 ortholog는 비슷한 기능을 유지하는 경우가 많기 때문입니다.

계통수도 단순히 “왼쪽과 오른쪽 중 누가 더 가깝다”만 보는 그림이 아닙니다. 계통수에서 중요한 것은 가장 최근의 공통조상입니다. 두 대상이 한 마디(node)를 더 최근에 공유하면 더 가까운 관계로 해석합니다. 가지가 길게 그려졌다고 항상 더 오래되었다는 뜻은 아닙니다. 계통수 종류에 따라 가지 길이가 시간, 변화량, 혹은 단순 배치일 수 있기 때문입니다. 그래서 계통수를 읽을 때는 “가지 길이가 무엇을 의미하는가”를 먼저 확인해야 합니다.

보존서열은 기능 예측의 강력한 단서입니다. 예를 들어 여러 종의 단백질을 정렬했을 때 특정 아미노산 위치가 거의 모두 같다면, 그 위치가 단백질 접힘, 효소 반응, 결합 부위에 중요할 수 있습니다. 반대로 빠르게 바뀌는 구간은 기능 제약이 약하거나, 면역 회피처럼 변화 자체가 유리한 영역일 수 있습니다. 단, 보존되어 있다고 항상 기능을 100% 안다는 뜻은 아닙니다. 보존성은 “중요할 가능성이 높다”는 단서이지, 최종 증거는 아닙니다.

실제 연구에서는 진화와 데이터 해석이 함께 움직입니다. 미지의 유전자가 발견되면 먼저 비슷한 서열을 데이터베이스에서 찾고, 정렬하고, 보존된 영역을 보고, 계통수를 그려 이미 알려진 유전자들과의 관계를 봅니다. 이 과정을 통해 “이 유전자는 어떤 가족에 속하는가”, “기능이 보존되었는가”, “종 특이적으로 새 기능을 얻었는가” 같은 질문을 던집니다.

초보자가 특히 조심해야 할 오해는 세 가지입니다. 첫째, 모든 진화적 변화가 좋은 방향으로 일어나는 것은 아닙니다. 둘째, 모든 서열 차이가 기능 차이를 뜻하지는 않습니다. 셋째, 비슷한 서열이라고 해서 무조건 같은 기능을 가진다고 단정할 수는 없습니다. 생물정보학자는 서열 유사성, 보존성, 계통 위치, 실험 근거를 함께 보고 조심스럽게 판단해야 합니다.

보강 학습 2: 진화는 개체의 의지가 아니라 집단의 빈도 변화다

진화를 데이터로 이해하려면 “개체가 필요해서 변한다”는 생각을 버려야 합니다. 진화는 세대를 지나며 집단 안 유전변이의 빈도가 변하는 과정입니다. 이 관점이 필요한 이유는 유전체 비교, 보존성, 자연선택 신호, 약제내성 해석의 바탕이 되기 때문입니다.

예를 들어 세균 집단에 항생제를 처리하면, 항생제에 약한 세균은 줄고 이미 내성 변이를 가진 세균은 살아남아 증식할 수 있습니다. 항생제가 세균에게 필요한 변이를 만들어 준다기보다, 기존 변이 중 살아남는 비율이 달라지는 것입니다.

간단한 숫자로 보면 처음에 내성 변이 빈도가 1%였는데 항생제 처리 뒤 60%가 되었다면, 집단의 유전적 구성이 크게 바뀐 것입니다. 이 변화는 selection, drift, migration, mutation 같은 힘으로 설명할 수 있습니다.

생물정보학에서는 종 사이 서열을 비교해 오래 보존된 구간을 찾습니다. 오래 보존된 염기나 아미노산은 기능적으로 중요했을 가능성이 있습니다. 하지만 보존성이 낮다고 무조건 기능이 없다는 뜻은 아닙니다. 빠르게 진화하는 면역 관련 유전자처럼 기능 때문에 빨리 변하는 경우도 있습니다.

핵심 정리

진화는 세대를 거치며 집단의 유전적 구성이 변하는 과정입니다. 돌연변이는 새로운 변이를 만들고, 자연선택과 유전적 부동은 변이의 빈도를 바꿀 수 있습니다. 계통수는 진화적 관계를 표현하고, 보존서열은 기능적으로 중요한 구간을 찾는 단서가 됩니다. 생물정보학에서 서열 비교와 기능 예측은 진화생물학 없이는 제대로 이해하기 어렵습니다.

문제 풀이

진화생물학의 기본

0 / 22
Gemini AI 채점

주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.

API KEY 미등록
  1. 1. [쉬움] 객관식

    진화의 뜻으로 가장 적절한 것은?

    선택지
  2. 2. [쉬움] 객관식

    자연선택과 유전적 부동의 차이로 가장 적절한 것은?

    선택지
  3. 3. [보통] 객관식

    서열 유사성과 상동성의 설명으로 가장 적절한 것은?

    선택지
  4. 4. [보통] 객관식

    ortholog에 대한 설명으로 가장 적절한 것은?

    선택지
  5. 5. [보통] 객관식

    paralog에 대한 설명으로 가장 적절한 것은?

    선택지
  6. 6. [보통] 객관식

    계통수를 읽을 때 가장 중요한 기준으로 적절한 것은?

    선택지
  7. 7. [데이터 해석] 객관식

    단백질 정렬에서 10종 모두 같은 위치에 같은 아미노산이 보존되어 있다. 가장 조심스러운 해석은?

    선택지
  8. 8. [사례] 객관식

    항생제를 처리하자 내성 변이를 가진 세균 비율이 여러 세대에 걸쳐 증가했다. 가장 적절한 설명은?

    선택지
  9. 9. [오개념] 객관식

    “모든 진화 변화는 적응이다”라는 말에 대한 평가로 가장 적절한 것은?

    선택지
  10. 10. [데이터 해석] 객관식

    두 단백질 A와 B가 85% 서열 유사성을 보인다. 가장 적절한 다음 분석 태도는?

    선택지
  11. 11. [계산] 객관식

    길이 20인 두 DNA 서열에서 같은 위치의 염기가 15개이다. 단순 일치율은?

    선택지
  12. 12. [계산] 객관식

    길이 12인 보존 모티프에서 9개 위치가 여러 종에서 동일하게 보존되었다. 보존 위치 비율은?

    선택지
  13. 주관식 13. [쉬움] 주관식 · Gemini 채점

    진화가 “개체 하나의 변신”이 아니라는 점을 설명하라.

  14. 주관식 14. [보통] 주관식 · Gemini 채점

    서열 유사성과 상동성의 차이를 설명하라.

  15. 주관식 15. [보통] 주관식 · Gemini 채점

    보존서열이 생물정보학에서 중요한 이유를 설명하라.

  16. 주관식 16. [어려움] 주관식 · Gemini 채점

    계통수를 해석할 때 “그림에서 가까이 그려진 것”만 보고 판단하면 위험한 이유를 설명하라.

  17. 주관식 17. [어려움] 주관식 · Gemini 채점

    미지의 단백질 기능을 진화 정보로 추정할 때 어떤 자료를 함께 봐야 하는지 설명하라.

  18. 18. [계산] 객관식

    어떤 내성 allele 빈도가 0.01에서 0.60으로 증가했다. 가장 적절한 해석은?

    선택지
  19. 19. [보통] 객관식

    항생제 처리 후 내성균 비율이 증가하는 가장 기본적인 설명은?

    선택지
  20. 20. [어려움] 객관식

    보존성이 높은 아미노산 위치를 해석할 때 적절한 태도는?

    선택지
  21. 주관식 21. [보통] 주관식 · Gemini 채점

    자연선택을 ‘개체가 필요해서 변한다’가 아니라 ‘집단 빈도가 변한다’로 설명하라.

  22. 주관식 22. [어려움] 주관식 · Gemini 채점

    유전체 비교에서 보존성과 빠른 진화를 각각 어떻게 해석할 수 있는지 설명하라.