4 분 소요

이 장에서 배울 것

이 장에서는 부모에게서 자식으로 정보가 전달되는 유전(heredity)과, 사람마다 DNA가 조금씩 다른 유전적 변이(genetic variation)를 배웁니다.

먼저 용어를 정리합니다.

  • 대립유전자(allele): 같은 유전자 위치에 존재할 수 있는 서로 다른 버전입니다.
  • 유전자형(genotype): 어떤 사람이 가진 유전적 구성입니다.
  • 표현형(phenotype): 키, 질병 여부, 혈액형처럼 관찰되는 특징입니다.
  • 단일염기변이(single nucleotide variant, SNV): DNA 한 글자가 다른 변이입니다.
  • 단일염기다형성(single nucleotide polymorphism, SNP): 집단에서 비교적 흔하게 관찰되는 SNV를 가리킬 때가 많습니다.
  • 삽입(insertion): DNA 글자가 추가된 변이입니다.
  • 결실(deletion): DNA 글자가 빠진 변이입니다.
  • 복제수 변이(copy number variation, CNV): DNA 구간의 복사본 수가 달라진 경우입니다.

유전적 변이

가장 쉬운 비유: 같은 책의 서로 다른 판본

사람들의 유전체를 같은 책의 여러 판본이라고 생각해 봅시다. 대부분의 문장은 같습니다. 하지만 어떤 사람의 책에는 한 글자가 다르고, 어떤 사람의 책에는 짧은 문장이 추가되어 있고, 어떤 사람의 책에는 특정 문단이 한 번 더 반복되어 있을 수 있습니다.

이 차이가 유전적 변이입니다. 변이는 항상 나쁜 것이 아닙니다. 많은 변이는 별다른 영향을 주지 않습니다. 일부 변이는 질병 위험, 약물 반응, 외모, 생리적 차이에 영향을 줄 수 있습니다.

대립유전자, 유전자형, 표현형

사람은 대부분의 상염색체 위치에서 어머니에게서 하나, 아버지에게서 하나의 DNA 사본을 받습니다. 그래서 같은 위치에 두 개의 버전이 있을 수 있습니다. 이 버전을 대립유전자라고 합니다.

유전자형은 개인이 가진 유전적 구성을 뜻합니다. 예를 들어 어떤 위치에서 A 버전과 a 버전을 가지고 있다면 그 위치의 유전자형은 Aa라고 표현할 수 있습니다.

표현형은 실제로 관찰되는 특징입니다. 키, 혈액형, 질병 여부, 특정 단백질의 기능 변화 등이 표현형이 될 수 있습니다. 중요한 점은 유전자형이 표현형에 영향을 주지만, 표현형은 환경과 다른 유전자의 영향도 받을 수 있다는 것입니다.

변이의 여러 종류

단일염기변이는 DNA 한 글자가 다른 경우입니다. 예를 들어 기준 서열이 A인데 어떤 사람은 G를 가진다면 한 글자 차이가 있는 것입니다.

삽입은 DNA 글자가 추가된 경우입니다. 결실은 DNA 글자가 빠진 경우입니다. 삽입과 결실을 함께 삽입결실(indel)이라고 부르기도 합니다.

복제수 변이는 어떤 DNA 구간의 복사본 수가 사람마다 다른 경우입니다. 예를 들어 어떤 유전자가 한 사람에게는 두 벌 있는데 다른 사람에게는 세 벌 있을 수 있습니다.

더 큰 구조 변화도 있습니다. 염색체 구간이 뒤집히거나, 다른 위치로 이동하거나, 큰 구간이 사라지는 경우입니다. 이런 변이를 구조 변이(structural variation)라고 하며, 큰 삭제(deletion), 중복(duplication), 역위(inversion), 전좌(translocation)처럼 유전체 구조 자체를 바꾸는 변이를 포함합니다.

생식세포 변이와 체세포 변이

변이는 어디에서 생겼는지에 따라 의미가 달라집니다.

부모에게서 물려받아 몸의 거의 모든 세포에 있는 변이를 생식세포 변이(germline variant)라고 합니다. 이런 변이는 자식에게 전달될 수 있습니다.

살아가는 동안 특정 세포에서 새로 생긴 변이를 체세포 변이(somatic mutation)라고 합니다. 암 연구에서는 체세포 변이가 특히 중요합니다. 암세포는 정상세포에서 시작해 여러 체세포 변이를 축적하며 성장할 수 있기 때문입니다.

변이는 질병과 어떻게 연결되는가

어떤 변이는 단백질의 아미노산을 바꾸고, 그 결과 단백질 기능을 망가뜨릴 수 있습니다. 어떤 변이는 유전자가 얼마나 읽히는지 바꿀 수 있습니다. 어떤 변이는 아무 영향도 거의 없을 수 있습니다.

따라서 변이를 발견했다고 바로 “이 변이가 질병 원인이다”라고 말하면 안 됩니다. 변이의 위치, 빈도, 기능적 영향, 가족력, 실험적 근거, 통계적 근거를 함께 봐야 합니다.

보강 학습: SNV, SNP, 기능 변이, 빈도 해석

SNV와 SNP는 구분해야 합니다. SNV는 DNA 한 글자가 다른 모든 경우를 넓게 부르는 말입니다. SNP는 그중 집단에서 비교적 흔하게 관찰되는 변이를 가리킬 때가 많습니다. 모든 SNP는 SNV로 볼 수 있지만, 모든 SNV가 SNP인 것은 아닙니다.

변이는 규모에 따라 나뉩니다. 한 글자 차이는 SNV, 짧은 삽입·결실은 indel, 어떤 DNA 구간의 복사본 수 차이는 CNV, 큰 구간의 삭제·중복·역위·전좌는 구조 변이(SV)입니다. 구조 변이는 유전자 기능뿐 아니라 유전자 발현과 염색체 안정성에도 영향을 줄 수 있습니다.

코딩 구간 변이는 기능적 결과에 따라 구분할 수 있습니다. 동의 변이는 DNA가 바뀌어도 아미노산이 바뀌지 않는 경우입니다. 미스센스 변이는 아미노산 하나가 바뀌는 경우입니다. 넌센스 변이는 중간에 종결 코돈이 생겨 단백질이 짧아질 수 있는 경우입니다. 프레임시프트 변이는 3의 배수가 아닌 삽입·결실로 읽기틀이 바뀌는 경우입니다.

생식세포 변이와 체세포 변이도 구분해야 합니다. 생식세포 변이는 부모에게서 물려받아 몸의 거의 모든 세포에 있고 자식에게 전달될 수 있습니다. 체세포 변이는 살아가며 특정 세포에서 새로 생기며, 암 연구에서 특히 중요합니다.

대립유전자 빈도는 병원성 해석의 중요한 단서입니다. 어떤 심각한 희귀질환의 원인이라고 주장되는 변이가 일반 인구에서 너무 흔하면 설명이 어렵습니다. 하지만 빈도만으로 판단하면 안 됩니다. 위치, 기능 영향, 가족력, 환자-대조군 통계, 기능 실험 근거가 함께 필요합니다.

보강 학습 2: 변이를 기능 변화로 해석하는 최소 절차

변이는 DNA 서열의 차이입니다. 하지만 모든 변이가 같은 중요도를 갖지는 않습니다. 변이 해석이 필요한 이유는 수많은 서열 차이 중에서 세포 기능이나 질병과 관련될 가능성이 큰 변이를 걸러야 하기 때문입니다.

가장 먼저 변이 위치를 봅니다. coding region인지, splice site인지, promoter나 enhancer 같은 조절 구간인지, 반복서열인지에 따라 해석이 달라집니다. coding region 안에서도 synonymous, missense, nonsense, frameshift 변이는 영향이 다릅니다. missense는 아미노산 하나가 바뀌는 것이고, nonsense는 조기 stop codon이 생기는 경우입니다.

간단한 비율 계산도 필요합니다. 어떤 샘플에서 전체 read 100개 중 30개가 변이 염기를 지지한다면 variant allele fraction은 30/100 = 0.30, 즉 30%입니다. 암 샘플에서는 이 값이 종양 순도, 복제수 변화, 이질성과 연결될 수 있습니다.

흔한 오해는 “변이가 있으면 반드시 병의 원인”이라고 보는 것입니다. 사람마다 많은 변이를 가지고 있고, 대부분은 중립적이거나 영향이 작습니다. 변이 위치, 보존성, 단백질 기능, 집단 빈도, 환자 표현형, 실험 근거를 함께 봐야 합니다.

핵심 정리

유전은 생명 정보가 세대로 전달되는 현상이고, 유전적 변이는 사람들 사이의 DNA 차이입니다. 대립유전자, 유전자형, 표현형을 구분해야 합니다. 단일염기변이, 삽입, 결실, 복제수 변이, 구조 변이처럼 변이에는 여러 종류가 있습니다. 변이는 질병 해석의 핵심 단서이지만, 발견된 변이가 곧바로 원인이라는 뜻은 아닙니다.

문제 풀이

유전과 변이

0 / 22
Gemini AI 채점

주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.

API KEY 미등록
  1. 1. [쉬움] 객관식

    대립유전자(allele)를 가장 잘 설명한 것은?

    선택지
  2. 2. [쉬움] 객관식

    SNV를 가장 잘 설명한 것은?

    선택지
  3. 3. [보통] 객관식

    SNP와 SNV의 관계로 적절한 것은?

    선택지
  4. 4. [보통] 객관식

    insertion/deletion(indel)을 가장 잘 설명한 것은?

    선택지
  5. 5. [보통] 객관식

    CNV(copy number variation)를 가장 잘 설명한 것은?

    선택지
  6. 6. [보통] 객관식

    구조 변이(structural variation)의 예로 적절한 것은?

    선택지
  7. 7. [어려움] 객관식

    coding region에 염기 1개 deletion이 생겼을 때 우려되는 결과는?

    선택지
  8. 8. [어려움] 객관식

    missense와 nonsense 변이의 차이로 적절한 것은?

    선택지
  9. 9. [쉬움] 객관식

    germline 변이를 가장 잘 설명한 것은?

    선택지
  10. 10. [보통] 객관식

    somatic 변이의 예로 적절한 것은?

    선택지
  11. 11. [보통] 객관식

    allele frequency 0.25의 의미로 가장 적절한 것은?

    선택지
  12. 12. [어려움] 객관식

    variant pathogenicity를 판단할 때 가장 적절한 태도는?

    선택지
  13. 주관식 13. [쉬움] 주관식 · Gemini 채점

    SNV, SNP, indel, CNV, structural variation을 각각 구분해 설명하라.

  14. 주관식 14. [보통] 주관식 · Gemini 채점

    synonymous, missense, nonsense, frameshift 변이를 단백질 관점에서 구분하라.

  15. 주관식 15. [보통] 주관식 · Gemini 채점

    germline 변이와 somatic 변이를 구분하고 각각 중요한 분석 맥락을 설명하라.

  16. 주관식 16. [어려움] 주관식 · Gemini 채점

    변이 빈도가 높거나 낮다는 사실만으로 병원성을 확정할 수 없는 이유를 설명하라.

  17. 주관식 17. [어려움] 주관식 · Gemini 채점

    조절부위 변이와 코딩 변이의 해석 차이를 설명하라.

  18. 18. [계산] 객관식

    전체 read 120개 중 변이 염기를 지지하는 read가 30개다. variant allele fraction은?

    선택지
  19. 19. [보통] 객관식

    nonsense 변이를 가장 잘 설명한 것은?

    선택지
  20. 20. [어려움] 객관식

    변이가 질병 원인인지 판단할 때 집단 빈도를 확인하는 이유는?

    선택지
  21. 주관식 21. [보통] 주관식 · Gemini 채점

    variant allele fraction의 의미와 계산법을 설명하라.

  22. 주관식 22. [어려움] 주관식 · Gemini 채점

    모든 변이가 병의 원인이 아닌 이유를 passenger 변이 또는 중립 변이 개념과 연결해 설명하라.