25 분 소요

1. 7챕터는 무엇을 하려는 장인가요?

7챕터는 “단백질을 직접 만드는 유전자 부분 말고도, 왜 유전체의 나머지 부분이 중요한가요?”라는 질문을 다룹니다.

처음 생명과학을 배우면 DNA를 “단백질 설계도”라고 이해하게 됩니다. 이 설명은 출발점으로는 좋습니다. 그런데 실제 인간 유전체를 보면 단백질 정보를 직접 담고 있는 영역은 아주 작습니다. 원문 7장은 인간 유전체에서 단백질 코딩 영역이 약 1.5%에 불과하고, 나머지 대부분은 인트론, 반복 서열, 전이인자, 조절 영역 같은 비코딩 영역으로 이루어져 있음을 다룹니다.

인간 유전체의 코딩/비코딩 구성

여기서 중요한 관점 전환이 필요합니다.

비코딩 영역은 “단백질을 만들지 않는 영역”이지, “아무 일도 하지 않는 영역”이 아닙니다.

비코딩 영역은 유전자가 언제 켜질지, 어느 조직에서 강하게 발현될지, 어떤 조건에서 조용해질지에 깊이 관여합니다. 그래서 7장을 읽기 전에는 DNA를 단순한 단백질 설계도라고만 보지 말고, 유전자 사용 설명서와 스위치가 함께 들어 있는 거대한 조절 시스템으로 보는 감각이 필요합니다.


2. “코딩”과 “비코딩”은 무엇이 다른가요?

코딩(coding)은 단백질의 아미노산 순서를 직접 지정하는 DNA 구간을 뜻합니다. 1~3장 선수지식에서 다룬 중심원리를 떠올리면 됩니다.

DNA → RNA → 단백질

이 흐름에서 단백질의 재료인 아미노산 순서를 직접 지정하는 구간이 코딩 영역입니다. 예를 들어 어떤 DNA 구간이 “이 순서대로 아미노산을 이어 붙여라”라는 정보를 담고 있다면, 그 구간은 코딩 영역입니다.

반대로 비코딩(non-coding)은 단백질의 아미노산 순서를 직접 지정하지 않는 영역입니다. 그런데 여기서 많은 초심자가 오해합니다. “단백질을 만들지 않으면 쓸모없는 것 아닌가요?”라고 생각하기 쉽습니다. 하지만 그렇지 않습니다.

비코딩 영역은 다음과 같은 역할을 할 수 있습니다.

  • 유전자가 켜지는 위치와 시간을 조절합니다.
  • RNA가 만들어지는 양을 조절합니다.
  • DNA가 접히고 보관되는 구조에 영향을 줍니다.
  • 여러 유전자 사이의 조절 네트워크에 관여합니다.
  • 과거 바이러스나 전이인자의 흔적으로 남아 유전체 진화에 영향을 줄 수 있습니다.
  • 단백질이 되지 않는 RNA를 만들어 다른 유전자를 조절할 수 있습니다.

비유하자면, 코딩 영역은 요리법의 “재료와 조리 순서”에 가깝습니다. 비코딩 영역은 “언제 이 요리를 만들지”, “얼마나 만들지”, “어느 식당 지점에서 만들지”, “어떤 상황에서는 만들지 말지”를 정하는 운영 규칙에 가깝습니다. 음식의 실제 맛은 재료만으로 결정되지 않습니다. 언제, 얼마나, 어떤 조건에서 조리되는지도 중요합니다.


3. 유전자 발현은 “유전자를 읽어서 RNA를 만드는 일”입니다

7장을 제대로 이해하려면 유전자 발현(gene expression)을 먼저 알아야 합니다.

유전자 발현이란 쉽게 말해 세포가 DNA에 적힌 특정 유전자 정보를 실제로 사용하는 일입니다. 가장 기본적인 발현은 DNA에서 RNA를 만드는 전사(transcription)입니다. 어떤 유전자가 전사되면 그 유전자는 “켜졌다”고 표현할 수 있습니다. 전사가 거의 일어나지 않으면 “꺼졌다”거나 “억제되었다”고 말할 수 있습니다.

중요한 점은 우리 몸의 모든 세포가 거의 같은 DNA를 가지고 있어도, 모든 세포가 같은 유전자를 같은 정도로 쓰는 것은 아니라는 점입니다.

예를 들어 피부세포와 간세포는 같은 사람의 DNA를 갖고 있습니다. 하지만 피부세포는 피부세포답게 살아가기 위한 유전자를 많이 켜고, 간세포는 간세포답게 대사와 해독에 필요한 유전자를 많이 켭니다. 즉, 세포의 정체성은 DNA 목록만으로 결정되지 않고, 어떤 유전자를 얼마나 발현하는지에 따라 결정됩니다.

그래서 7~9장의 중심 질문은 이렇게 정리할 수 있습니다.

“DNA에 무엇이 적혀 있는가?”뿐만 아니라 “그중 무엇을 실제로 읽고 있는가?”가 중요합니다.


4. 프로모터, 인핸서, 전사인자는 유전자 스위치 시스템입니다

유전자가 발현되려면 RNA 중합효소라는 분자 기계가 DNA에 붙어 RNA를 만들어야 합니다. 그런데 RNA 중합효소가 아무 데나 막 붙는 것은 아닙니다. 유전자 주변에는 발현을 조절하는 여러 DNA 구간과 단백질들이 있습니다.

가장 기본적으로 알아야 할 개념은 다음 네 가지입니다.

개념 쉬운 설명 역할
프로모터 유전자 앞쪽의 전사 시작 구간 RNA 중합효소가 일을 시작하는 자리입니다.
인핸서 멀리 떨어져 있어도 발현을 높일 수 있는 조절 구간 특정 유전자의 발현을 강하게 만들 수 있습니다.
전사인자 DNA 조절 구간에 붙는 단백질 유전자를 켜거나 끄는 조절자입니다.
RNA 중합효소 DNA를 읽어 RNA를 만드는 효소 실제 전사 작업을 수행합니다.

유전자 발현 조절 스위치

프로모터는 유전자의 “시작 버튼”에 가깝습니다. RNA 중합효소가 이 근처에 잘 붙으면 전사가 시작됩니다. 인핸서는 멀리 떨어져 있어도 DNA가 3차원으로 접히면서 프로모터와 가까워질 수 있습니다. 그래서 인핸서는 물리적으로는 멀리 있지만 기능적으로는 특정 유전자의 발현을 크게 바꿀 수 있습니다.

전사인자는 이 조절 구간에 붙어 신호를 전달하는 단백질입니다. 어떤 전사인자는 발현을 촉진하고, 어떤 전사인자는 발현을 억제합니다. 세포는 이런 조절자들을 조합해서 “이 유전자는 지금 켜라”, “이 유전자는 이 조직에서만 켜라”, “이 유전자는 스트레스를 받을 때만 켜라” 같은 결정을 내립니다.

이 개념이 중요한 이유는 GWAS와 연결되기 때문입니다. 5장에서는 GWAS가 질병과 관련된 변이를 찾는 방법이라고 배웠습니다. 그런데 많은 GWAS 변이는 단백질 코딩 영역이 아니라 비코딩 조절 영역에 있습니다. 즉, 질병 위험을 높이는 변이가 단백질 모양을 직접 바꾸는 것이 아니라, 어떤 유전자의 발현량을 바꾸는 방식으로 작용할 수 있습니다.


5. GWAS 변이가 비코딩 영역에 많다는 것은 무슨 뜻일까요?

4~6장 선수지식에서 GWAS는 “많은 사람의 유전변이를 비교해서 질병이나 형질과 관련된 위치를 찾는 연구”라고 설명했습니다. 자세한 내용은 5장 선수지식의 GWAS 부분을 참고하시면 됩니다.

7장에서는 여기서 한 단계 더 들어갑니다. GWAS로 질병 관련 변이를 찾았는데, 그 변이가 단백질을 직접 바꾸는 영역이 아니라면 어떻게 해석해야 할까요?

처음에는 당황스러울 수 있습니다. “단백질을 바꾸지 않는 변이가 왜 질병과 관련될까요?”라고 생각할 수 있습니다. 답은 발현 조절입니다.

어떤 변이가 인핸서나 프로모터에 생기면 다음과 같은 일이 일어날 수 있습니다.

  • 특정 유전자가 너무 많이 발현됩니다.
  • 특정 유전자가 너무 적게 발현됩니다.
  • 원래는 한 조직에서만 발현되어야 할 유전자가 다른 조직에서도 발현됩니다.
  • 특정 환경이나 자극에 대한 반응이 달라집니다.

비유하자면, 자동차 엔진 부품 자체는 멀쩡한데 가속 페달이나 브레이크 조절 장치에 문제가 생기는 상황과 비슷합니다. 엔진 구조가 바뀌지 않아도, 조절 장치가 잘못 작동하면 차의 움직임은 크게 달라집니다.

그래서 7장을 읽을 때는 다음 문장을 기억하면 좋습니다.

비코딩 변이는 단백질의 모양을 바꾸지 않아도, 유전자가 켜지는 양과 상황을 바꿔 질병에 영향을 줄 수 있습니다.


6. QTL과 eQTL은 “형질을 바꾸는 위치”와 “발현량을 바꾸는 위치”입니다

QTL(Quantitative Trait Loci)은 양적 형질에 영향을 주는 유전체 위치를 뜻합니다. 양적 형질이란 키, 몸무게, 혈압, 콜레스테롤 수치처럼 숫자로 어느 정도 연속적으로 측정할 수 있는 특징입니다.

예를 들어 어떤 DNA 변이를 가진 사람들이 평균적으로 혈압이 조금 높다면, 그 변이가 있는 유전체 근처가 혈압이라는 양적 형질에 영향을 주는 QTL일 수 있습니다.

그중 eQTL(Expression Quantitative Trait Loci)은 특별히 유전자 발현량에 영향을 주는 유전체 위치입니다. 즉, 어떤 DNA 변이를 가진 사람은 특정 유전자의 RNA가 많이 만들어지고, 다른 변이를 가진 사람은 적게 만들어진다면, 그 변이는 eQTL일 수 있습니다.

cis-eQTL과 trans-eQTL

eQTL은 크게 cis-eQTL과 trans-eQTL로 나눌 수 있습니다.

cis-eQTL은 가까운 유전자의 발현에 영향을 주는 변이입니다. 예를 들어 어떤 유전자 바로 앞의 인핸서에 변이가 생겨 그 유전자의 발현량이 바뀌는 경우입니다. “가까운 스위치가 가까운 전등을 조절한다”고 생각하면 됩니다.

trans-eQTL은 멀리 떨어진 유전자의 발현에 영향을 주는 변이입니다. 심지어 다른 염색체에 있는 유전자 발현에도 영향을 줄 수 있습니다. 예를 들어 어떤 변이가 전사인자의 기능이나 발현량을 바꾸면, 그 전사인자가 조절하는 여러 유전자의 발현이 함께 달라질 수 있습니다. “중앙 제어실의 설정이 여러 방의 전등을 바꾼다”고 생각하면 됩니다.


7. 조직별 발현 조절이 왜 중요한가요?

같은 유전변이라도 모든 조직에서 같은 효과를 내지는 않습니다. 어떤 변이는 간에서 특정 유전자의 발현을 바꿀 수 있지만, 뇌에서는 별 영향이 없을 수 있습니다. 어떤 변이는 면역세포에서만 의미 있게 작동할 수도 있습니다.

이것이 중요한 이유는 질병이 조직 특이성을 갖기 때문입니다.

예를 들어 어떤 변이가 췌장 세포에서 인슐린 관련 유전자의 발현을 바꾼다면 당뇨병과 관련될 수 있습니다. 같은 변이가 뇌에서 거의 작동하지 않는다면 정신질환과는 직접적 관련이 약할 수 있습니다. 반대로 뇌 특정 영역에서 신경전달물질 관련 유전자 발현을 바꾸는 변이는 신경질환이나 정신질환 해석에 중요할 수 있습니다.

GTEx 같은 프로젝트는 여러 조직에서 유전변이와 유전자 발현의 관계를 조사합니다. 이를 통해 연구자는 “이 GWAS 변이가 실제로 어느 조직에서 어떤 유전자를 조절하는가?”를 더 구체적으로 물을 수 있습니다.

초심자 관점에서는 GTEx를 이렇게 이해하면 됩니다.

GTEx는 여러 인체 조직에서 DNA 변이와 RNA 발현량의 관계를 모아놓은 거대한 참고 지도입니다.


8. 트랜스포존은 유전체 안에서 이동하거나 복사된 흔적입니다

트랜스포존(transposon)은 유전체 안에서 위치를 옮기거나 복사될 수 있는 DNA 요소입니다. 그래서 “jumping gene”, 즉 뛰어다니는 유전자라는 별명도 있습니다. 단, 현대 인간 유전체 안의 많은 트랜스포존은 더 이상 활발히 움직이지 않는 흔적처럼 남아 있습니다.

레트로트랜스포존(retrotransposon)은 RNA 중간체를 거쳐 다시 DNA로 복사되어 유전체에 들어가는 방식의 요소입니다. 원문 7장에서는 LINE, SINE, LTR 레트로트랜스포존, 내인성 레트로바이러스 같은 개념이 등장합니다.

여기서 처음부터 모든 이름을 외울 필요는 없습니다. 핵심은 다음입니다.

인간 유전체에는 과거에 복사되고 삽입된 반복 서열과 바이러스 유래 흔적이 매우 많이 남아 있으며, 이것들이 유전체 구조와 유전자 조절에 영향을 줄 수 있습니다.

트랜스포존은 질병과도 관련될 수 있습니다. 어떤 위치에 삽입되느냐에 따라 유전자를 방해할 수도 있고, 새로운 조절 구간처럼 작동할 수도 있습니다. 장기적으로는 유전체 진화의 재료가 되기도 합니다.

비유하자면, 트랜스포존은 오래된 도시 곳곳에 남아 있는 낡은 철도, 폐공장, 옛 군사시설 같은 것입니다. 처음 만들어진 목적은 사라졌을 수 있지만, 도시 구조에 흔적을 남기고, 어떤 곳은 새롭게 재활용되며, 어떤 곳은 문제를 일으킬 수도 있습니다.


9. 비코딩 RNA는 단백질이 되지 않는 RNA입니다

RNA는 흔히 DNA와 단백질 사이의 중간 전달자라고 배웁니다. 특히 mRNA는 DNA 정보를 복사해서 단백질을 만드는 데 사용됩니다. 하지만 모든 RNA가 단백질로 번역되는 것은 아닙니다.

비코딩 RNA(non-coding RNA, ncRNA)는 단백질이 되지 않지만 세포 안에서 기능을 하는 RNA입니다.

비코딩 RNA의 역할

대표적인 비코딩 RNA는 다음과 같습니다.

종류 대략적 특징 쉬운 이해
miRNA 짧은 RNA, 표적 mRNA의 발현 억제 특정 메시지를 약하게 만드는 작은 조절자입니다.
siRNA 특정 mRNA를 정밀하게 분해 원하는 메시지를 잘라 없애는 표적 도구입니다.
lncRNA 긴 비코딩 RNA, 전사와 크로마틴 조절 관여 단백질은 아니지만 조절 구조를 만드는 긴 RNA입니다.
circRNA 고리 모양 RNA 다른 RNA 조절자를 붙잡는 스펀지처럼 작동할 수 있습니다.

여기서 중요한 것은 “RNA = 단백질을 만들기 위한 중간 단계”라는 단순한 생각을 넘어서는 것입니다. RNA 자체가 조절자일 수 있습니다. 그래서 비코딩 RNA는 암, 신경질환, 심혈관질환, 유전질환 연구에서 진단 바이오마커나 치료 표적으로 주목받습니다.



본편 진입 전 보강: 인간 유전체 구성 비율을 숫자로 읽기

7챕터 본편은 인간 유전체에서 단백질 코딩 영역이 약 1.5%에 불과하다는 사실에서 출발합니다. 이 말은 “나머지는 전부 쓰레기”라는 뜻이 아닙니다. 단백질의 아미노산 순서를 직접 지정하지 않는 영역이 훨씬 많다는 뜻입니다.

유전체 구성 비율과 eQTL 거리 감각

100쪽짜리 책으로 비유하면, 단백질 조리법을 직접 적은 페이지는 약 1.5쪽 정도입니다. 나머지에는 조절 규칙, 반복 서열, 인트론, 전이인자 흔적, 구조적 정보 등이 들어 있습니다.

본편에 나오는 LINE, SINE, LTR 레트로트랜스포존은 모두 반복 서열과 이동성 요소의 큰 범주 안에서 이해하면 됩니다. 처음부터 이름을 모두 외우기보다 다음처럼 묶어두면 됩니다.

구분 아주 쉬운 이해
LINE 스스로 복사·이동하는 데 필요한 요소를 비교적 많이 가진 긴 반복 요소입니다.
SINE 스스로 모든 도구를 갖지는 못한 짧은 반복 요소입니다.
LTR 레트로트랜스포존 레트로바이러스와 비슷한 흔적을 가진 반복 요소입니다.
단순 반복 서열 짧은 글자 묶음이 여러 번 반복되는 구간입니다.
분절 중복 긴 DNA 구간이 복사되어 다른 위치에도 비슷하게 존재하는 현상입니다.

본편 진입 전 보강: Mb 단위와 cis-eQTL 거리 감각

유전체학에서는 bp, kb, Mb 같은 단위를 자주 씁니다.

1 bp = 염기 1개
1 kb = 1,000 bp
1 Mb = 1,000,000 bp

본편에서 cis-eQTL을 설명할 때 “표적 유전자로부터 1Mb 이내” 같은 표현이 나올 수 있습니다. 이 말은 염기 약 100만 개 거리 안쪽에 있는 변이를 가까운 조절 후보로 보는 경우가 많다는 뜻입니다. 현실에서는 연구 설계마다 기준이 다를 수 있지만, 입문 단계에서는 cis = 가까운 조절, trans = 먼 조절로 이해하면 충분합니다.

본편 진입 전 보강: 비코딩 RNA도 데이터 분석 대상입니다

비코딩 RNA는 단순히 이름만 외우는 대상이 아닙니다. 의생명정보학에서는 비코딩 RNA도 데이터로 분석합니다.

대표적인 분석 흐름은 다음과 같습니다.

RNA-seq으로 발현량 측정
→ miRNA 표적 예측으로 어떤 mRNA를 조절할지 추정
→ GO/pathway 분석으로 관련 기능 추정
→ 네트워크 분석으로 여러 RNA와 유전자의 관계 파악

즉, 7장에서 비코딩 RNA를 볼 때는 “단백질이 되지 않는 RNA도 발현량을 측정하고, 표적을 예측하고, 질병 네트워크 안에서 해석할 수 있다”는 감각을 잡으면 됩니다.

10. 7챕터를 읽기 전 최소 체크리스트

7장을 읽기 전에는 다음 정도를 알고 있으면 됩니다.

확인 질문 알고 있어야 할 감각  
코딩 영역과 비코딩 영역의 차이는 무엇인가요? 코딩은 단백질 정보를 직접 담고, 비코딩은 주로 조절과 구조에 관여할 수 있습니다.  
프로모터와 인핸서는 무엇인가요? 유전자가 켜지는 위치와 강도를 조절하는 DNA 구간입니다.  
전사인자는 무엇인가요? DNA 조절 구간에 붙어 유전자 발현을 조절하는 단백질입니다.  
GWAS 변이가 비코딩 영역에 많다는 것은 왜 중요한가요? 질병 위험이 단백질 모양보다 발현 조절 변화와 관련될 수 있음을 뜻합니다.  
eQTL은 무엇인가요? DNA 변이와 유전자 발현량 사이의 연결고리를 찾는 개념입니다.  
비코딩 RNA는 무엇인가요? 단백질이 되지 않아도 발현 조절 등 기능을 수행하는 RNA입니다.  
유전체 구성 비율 단백질 코딩 영역은 약 1.5%이고 나머지는 다양한 비코딩 요소입니다. LINE, SINE, LTR, 인트론, 반복 서열의 큰 그림을 잡게 해줍니다.
Mb 단위 1Mb는 염기 약 100만 개입니다. cis-eQTL 거리 기준을 읽는 데 필요합니다.
비코딩 RNA 분석 발현량 측정, 표적 예측, 기능 분석, 네트워크 분석으로 이어집니다. 비코딩 RNA를 데이터 분석 대상으로 이해하게 해줍니다.

문제 풀이

비코딩 유전체와 발현 조절

0 / 23
Gemini AI 채점

주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.

API KEY 미등록
  1. 1. [쉬움] 객관식

    코딩 영역에 대한 설명으로 가장 적절한 것은 무엇인가?

    선택지
  2. 2. [쉬움] 객관식

    비코딩 영역에 대한 설명으로 가장 적절한 것은 무엇인가?

    선택지
  3. 3. [쉬움] 객관식

    유전자 발현의 기본 의미로 가장 적절한 것은 무엇인가?

    선택지
  4. 4. [쉬움] 객관식

    프로모터, 인핸서, 전사인자의 관계로 가장 적절한 것은 무엇인가?

    선택지
  5. 5. [보통] 객관식

    GWAS 변이가 비코딩 영역에 많이 있다는 사실의 의미로 가장 적절한 것은 무엇인가?

    선택지
  6. 6. [보통] 객관식

    QTL과 eQTL에 대한 설명으로 가장 적절한 것은 무엇인가?

    선택지
  7. 7. [보통] 객관식

    조직별 발현 조절이 중요한 이유로 가장 적절한 것은 무엇인가?

    선택지
  8. 8. [보통] 객관식

    비코딩 RNA에 대한 설명으로 가장 적절한 것은 무엇인가?

    선택지
  9. 9. [어려움] 객관식

    “비코딩은 무기능과 같은 말이 아니다”라는 설명으로 가장 적절한 것은 무엇인가?

    선택지
  10. 10. [어려움] 객관식

    cis-eQTL과 trans-eQTL의 차이에 대한 설명으로 가장 적절한 것은 무엇인가?

    선택지
  11. 11. [어려움] 객관식

    트랜스포존을 유전체 조절 관점에서 이해할 때 가장 적절한 설명은 무엇인가?

    선택지
  12. 12. [어려움] 객관식

    다음 중 7챕터의 핵심 관점으로 가장 적절한 것은 무엇인가?

    선택지
  13. 13. [보통] 객관식

    계산형: 100쪽짜리 책에서 단백질 코딩 영역이 1.5%라면 대략 몇 쪽인가?

    선택지
  14. 14. [보통] 객관식

    계산형: 1Mb는 대략 몇 개의 염기를 뜻하는가?

    선택지
  15. 15. [보통] 객관식

    cis-eQTL을 가장 적절히 설명한 것은 무엇인가?

    선택지
  16. 16. [보통] 객관식

    LINE, SINE, LTR을 처음 배울 때 가장 적절한 큰 범주 이해는 무엇인가?

    선택지
  17. 17. [보통] 객관식

    비코딩 RNA의 의생명정보학적 분석 흐름으로 가장 적절한 것은 무엇인가?

    선택지
  18. 18. [보통] 객관식

    비코딩 영역이 “단백질을 만들지 않는다”는 말의 올바른 해석은 무엇인가?

    선택지
  19. 19. [보통] 객관식

    trans-eQTL의 예로 가장 적절한 것은 무엇인가?

    선택지
  20. 20. [보통] 객관식

    GTEx를 가장 적절히 설명한 것은 무엇인가?

    선택지
  21. 1. [쉬움] 주관식 · Gemini 채점

    코딩 영역과 비코딩 영역의 차이를 설명하라.

  22. 2. [보통] 주관식 · Gemini 채점

    프로모터, 인핸서, 전사인자가 유전자 발현 조절에서 어떤 역할을 하는지 설명하라.

  23. 3. [어려움] 주관식 · Gemini 채점

    GWAS 변이가 비코딩 영역에 많다는 사실이 질병 연구에서 왜 중요한지 설명하라.