부록 A05: RNA와 전사체
이 장에서 배울 것
이 장에서는 RNA(ribonucleic acid)를 배웁니다. 앞으로는 그냥 RNA라고 부르겠습니다. DNA가 오래 보관하는 원본 문서라면, RNA는 그 원본에서 필요한 부분을 읽어 만든 작업 문서에 가깝습니다.
먼저 용어를 정리합니다.
- 전사(transcription): DNA 정보를 RNA로 베껴 만드는 과정입니다.
- 전사체(transcriptome): 특정 세포나 조직에서 만들어진 RNA 전체입니다.
- 전령 RNA(messenger RNA, mRNA): 단백질을 만들기 위한 정보를 담는 RNA입니다.
- 비암호화 RNA(non-coding RNA): 단백질로 번역되지 않지만 기능을 가진 RNA입니다.
- 이어붙이기(splicing): RNA에서 필요한 부분을 남기고 불필요한 부분을 제거해 이어 붙이는 과정입니다.
가장 쉬운 비유: RNA는 복사해서 쓰는 작업지입니다
도서관에 원본 책이 하나 있다고 합시다. 원본 책을 매번 들고 나가서 낙서하고 자르면 위험합니다. 그래서 필요한 페이지를 복사해서 작업지로 쓰는 편이 안전합니다. DNA가 원본 책이라면 RNA는 복사된 작업지에 가깝습니다.
세포는 필요한 유전자 정보를 DNA에서 RNA로 읽어냅니다. 이 과정이 전사입니다. 그리고 어떤 RNA는 단백질을 만드는 데 쓰이고, 어떤 RNA는 조절 기능을 합니다.
DNA와 RNA의 차이
DNA와 RNA는 둘 다 핵산이지만 차이가 있습니다. DNA는 A, T, G, C 염기를 사용하고, RNA는 A, U, G, C 염기를 사용합니다. DNA의 T 대신 RNA에서는 U가 쓰인다고 보면 됩니다.
DNA는 비교적 안정적으로 정보를 오래 보관하는 데 적합합니다. RNA는 상대적으로 덜 안정적이고, 필요할 때 만들어졌다가 분해되는 경우가 많습니다. 그래서 RNA는 “지금 세포가 어떤 정보를 사용하고 있는가”를 보여주는 좋은 단서가 됩니다.
여러 종류의 RNA
전령 RNA는 단백질을 만들기 위한 정보를 담습니다. DNA의 유전자 정보가 전령 RNA로 전사되고, 리보솜이 이 정보를 읽어 단백질을 만듭니다.
리보솜 RNA와 운반 RNA도 중요합니다. 리보솜 RNA는 단백질을 만드는 리보솜의 핵심 구성 요소이고, 운반 RNA는 아미노산을 리보솜으로 가져오는 역할을 합니다.
비암호화 RNA는 단백질로 번역되지 않지만 조절 기능을 가질 수 있습니다. 작은 RNA나 긴 비암호화 RNA는 유전자 발현 조절, 염색질 상태, 세포 기능에 영향을 줄 수 있습니다.
이어붙이기와 여러 전사체
진핵생물의 유전자는 필요한 부분과 중간에 끼어 있는 부분으로 나뉘는 경우가 많습니다. RNA가 처음 만들어진 뒤, 필요한 부분을 이어 붙이는 과정이 일어납니다. 이것이 이어붙이기입니다.
중요한 점은 같은 유전자에서도 이어붙이는 방식이 달라질 수 있다는 것입니다. 이 경우 하나의 유전자에서 여러 종류의 RNA가 만들어질 수 있습니다. 이렇게 만들어진 서로 다른 RNA 형태를 전사체 동형(transcript isoform)이라고 합니다.
RNA-seq이 중요한 이유
RNA-seq은 세포나 조직 안에 어떤 RNA가 얼마나 있는지 측정하는 기술입니다. RNA 양을 보면 어떤 유전자가 많이 사용되고 있는지 추정할 수 있습니다.
하지만 RNA 양이 단백질 양과 항상 정확히 같지는 않습니다. RNA가 많아도 단백질로 적게 만들어질 수 있고, 단백질이 오래 남아 있을 수도 있습니다. 그래서 RNA-seq 결과는 “유전자 사용의 중요한 단서”이지, 생명현상 전체를 완벽히 보여주는 것은 아닙니다.
보강 학습: RNA 종류, 스플라이싱, RNA-seq 해석
RNA는 mRNA만 뜻하지 않습니다. mRNA는 단백질을 만드는 정보를 담고, rRNA는 리보솜의 핵심 구성 성분이며, tRNA는 번역 과정에서 아미노산을 운반합니다. miRNA나 lncRNA 같은 비암호화 RNA는 단백질로 번역되지 않아도 조절 기능을 가질 수 있습니다.
진핵세포에서는 처음 만들어진 pre-mRNA가 바로 최종 mRNA가 되지 않는 경우가 많습니다. pre-mRNA에는 엑손과 인트론이 함께 있고, 스플라이싱을 통해 인트론이 제거되고 엑손이 이어 붙습니다. 5′ cap과 poly-A tail 같은 처리도 RNA 안정성과 번역에 영향을 줍니다.
대체 스플라이싱은 하나의 유전자에서 여러 RNA 아이소폼을 만들 수 있게 합니다. 유전자 총 발현량은 같아도 어떤 아이소폼이 많아졌는지에 따라 단백질 기능이 달라질 수 있습니다. 따라서 전사체 분석에서는 유전자 수준 발현량과 아이소폼 수준 변화를 구분하는 감각이 필요합니다.
RNA-seq count는 “DNA가 몇 개 있는가”가 아니라 “그 조건에서 RNA가 얼마나 관찰되었는가”를 뜻합니다. 샘플 품질, sequencing depth, 정규화, batch effect, 세포 조성, 아이소폼 구성에 따라 해석이 달라집니다. RNA 양이 단백질 기능과 항상 같은 방향으로 움직이는 것도 아닙니다.
간단한 서열 감각도 필요합니다. DNA coding strand가 ATG GAA TTT라면 mRNA는 보통 T를 U로 바꾼 AUG GAA UUU로 생각할 수 있습니다. 이 서열은 세 개의 코돈을 가집니다.
보강 학습 2: RNA 발현량 변화와 fold change 읽기
전사체 데이터를 해석하려면 “발현량이 다르다”를 숫자로 표현하는 방법이 필요합니다. 가장 쉬운 방법은 두 조건의 비율을 보는 것입니다. 이를 fold change라고 부릅니다. 공식은 fold change = 조건 B 발현량 / 조건 A 발현량입니다.
예를 들어 정상 세포에서 유전자 X의 발현량이 25, 처리 세포에서 100이라면 fold change는 100/25 = 4입니다. 처리 조건에서 RNA 양이 4배 높다는 뜻입니다. 반대로 정상 80, 처리 20이면 fold change는 20/80 = 0.25입니다. 처리 조건에서 4분의 1로 낮아졌다고 읽을 수 있습니다.
왜 필요한가? RNA-seq 결과표에는 수천~수만 개 유전자가 나오므로, 어떤 유전자가 조건에 따라 크게 달라졌는지 빠르게 골라야 합니다. fold change는 그 첫 번째 단서입니다. 하지만 발현량이 아주 낮은 유전자는 작은 read 차이로도 큰 fold change처럼 보일 수 있습니다. 예를 들어 1에서 4로 증가하면 4배지만, 절대량은 여전히 작습니다.
또한 RNA 증가는 단백질 증가와 같지 않습니다. mRNA 안정성, 번역 효율, microRNA 조절, 단백질 분해가 모두 영향을 줍니다. 따라서 RNA-seq 결과는 “유전자 사용 방식이 바뀌었다”는 증거에 가깝고, 기능 변화는 추가 실험이나 다른 오믹스 자료로 확인해야 합니다.
핵심 정리
RNA는 DNA 정보를 사용하는 과정에서 만들어지는 핵산입니다. 전사는 DNA 정보를 RNA로 읽어내는 과정이고, 전사체는 특정 상태에서 만들어진 RNA 전체입니다. RNA 분석은 세포가 어떤 유전자를 사용하고 있는지 이해하는 핵심 방법이지만, RNA 양을 단백질 기능과 단순히 동일시하면 안 됩니다.
문제 풀이
RNA와 전사체
주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.
-
1. [쉬움] 객관식
RNA에서 DNA의 T 대신 주로 쓰이는 염기는?
-
2. [쉬움] 객관식
전사(transcription)를 가장 잘 설명한 것은?
-
3. [보통] 객관식
mRNA의 대표 역할은?
-
4. [보통] 객관식
pre-mRNA와 mature mRNA의 차이로 적절한 것은?
-
5. [보통] 객관식
alternative splicing이 중요한 이유는?
-
6. [보통] 객관식
RNA-seq count를 해석할 때 적절한 태도는?
-
7. [어려움] 객관식
DNA coding strand가 5’-ATG GAA TAA-3’라면 mRNA 서열은?
-
8. [어려움] 객관식
같은 유전자의 총 발현량은 비슷하지만 isoform 비율이 크게 달라졌다면 주의할 점은?
-
9. [쉬움] 객관식
rRNA와 tRNA가 중요한 이유는?
-
10. [보통] 객관식
RNA가 DNA보다 일반적으로 불안정한 편인 이유로 적절한 것은?
-
11. [보통] 객관식
전사체가 유전체보다 조건 변화에 민감한 이유는?
-
12. [어려움] 객관식
RNA-seq에서 특정 유전자의 발현 증가를 바로 “원인”이라고 단정하기 어려운 이유는?
-
주관식 13. [쉬움] 주관식 · Gemini 채점
DNA와 RNA의 차이를 염기, 안정성, 역할 중심으로 설명하라.
-
주관식 14. [보통] 주관식 · Gemini 채점
pre-mRNA, splicing, mature mRNA, isoform의 관계를 설명하라.
-
주관식 15. [보통] 주관식 · Gemini 채점
RNA-seq count가 높다는 말을 해석할 때 고려해야 할 요소를 3가지 이상 쓰라.
-
주관식 16. [어려움] 주관식 · Gemini 채점
총 유전자 발현량과 isoform 비율을 구분해야 하는 이유를 설명하라.
-
주관식 17. [어려움] 주관식 · Gemini 채점
RNA 발현 증가를 질병 원인이라고 바로 결론내리면 안 되는 이유를 설명하라.
-
18. [계산] 객관식
정상 발현량 25, 처리 후 발현량 100인 유전자의 fold change는?
-
19. [보통] 객관식
발현량이 1에서 4로 증가한 유전자를 해석할 때 주의할 점은?
-
20. [어려움] 객관식
mRNA 증가가 단백질 증가로 이어지지 않을 수 있는 이유로 가장 적절한 것은?
-
주관식 21. [보통] 주관식 · Gemini 채점
fold change가 왜 유용한지와 어떤 한계가 있는지 설명하라.
-
주관식 22. [어려움] 주관식 · Gemini 채점
RNA-seq에서 유전자 X가 증가했을 때 가능한 생물학적 원인 3가지를 제시하라.