5 분 소요

이 장에서 배울 것

이번 장에서는 DNA와 RNA를 화학 분자로 이해합니다. 부록 A에서는 DNA와 RNA를 정보 저장과 정보 사용의 관점에서 보았습니다. 여기서는 한 단계 더 들어가서, DNA와 RNA가 어떤 부품으로 만들어졌고 왜 안정성 차이가 생기는지 봅니다.

핵심 용어를 먼저 정리하겠습니다.

  • 핵산(nucleic acid): DNA와 RNA처럼 유전 정보와 관련된 생체분자입니다.
  • 뉴클레오타이드(nucleotide): 핵산을 이루는 기본 단위입니다.
  • 당(sugar): DNA와 RNA의 뼈대 일부를 이루는 당 분자입니다.
  • 인산기(phosphate group): 핵산의 뼈대에 포함되며 음전하를 띠는 작용기입니다.
  • 염기(base): A, T, G, C, U처럼 유전 정보를 구분하는 부분입니다.
  • 인산다이에스터 결합(phosphodiester bond): 뉴클레오타이드들을 길게 이어주는 결합입니다.
  • 염기쌍(base pair): A-T, G-C처럼 서로 짝을 이루는 염기 조합입니다.

핵산의 화학

가장 쉬운 비유: 핵산은 구슬 목걸이와 암호표를 합친 구조입니다

DNA와 RNA는 긴 사슬입니다. 구슬 목걸이처럼 작은 단위가 반복해서 이어져 있습니다. 그런데 각 구슬에는 A, T, G, C 또는 U 같은 글자표가 붙어 있습니다. 사슬의 뼈대는 구조를 유지하고, 글자표의 순서는 정보를 담습니다.

이때 구슬 하나에 해당하는 기본 단위가 뉴클레오타이드입니다. 뉴클레오타이드는 크게 세 부분으로 이루어져 있습니다. 당, 인산기, 염기입니다. 당과 인산기는 사슬의 뼈대를 만들고, 염기는 유전 정보를 구분합니다.

뉴클레오타이드는 핵산의 기본 단위입니다

뉴클레오타이드는 핵산을 이루는 기본 블록입니다. 하나의 뉴클레오타이드는 당, 인산기, 염기로 구성됩니다.

당은 사슬의 중심 뼈대 역할을 합니다. DNA에는 디옥시리보스(deoxyribose)라는 당이 있고, RNA에는 리보스(ribose)라는 당이 있습니다. 이름이 어렵지만 핵심은 간단합니다. DNA와 RNA는 당의 구조가 조금 다릅니다.

인산기는 뉴클레오타이드들을 연결하는 데 중요합니다. 인산기는 음전하를 띠므로 DNA와 RNA 전체는 음전하를 가진 긴 분자입니다. 그래서 전기영동(gel electrophoresis, 전기장을 걸어 분자를 크기와 전하에 따라 이동시키는 실험)에서 핵산이 이동할 수 있습니다.

염기는 정보를 담는 부분입니다. DNA에서는 A, T, G, C가 사용되고, RNA에서는 A, U, G, C가 사용됩니다. T는 티민(thymine), U는 유라실(uracil)입니다.

인산다이에스터 결합은 핵산의 줄을 만듭니다

뉴클레오타이드는 인산다이에스터 결합으로 이어져 긴 사슬을 만듭니다. 이 결합은 한 뉴클레오타이드의 당과 다음 뉴클레오타이드의 인산기를 연결합니다.

비유하면 전선의 피복처럼, 당-인산 뼈대는 정보를 담은 염기들을 일정한 순서로 붙잡아 줍니다. 염기가 정보라면, 당-인산 뼈대는 그 정보를 줄줄이 배열하는 책등 같은 역할을 합니다.

핵산에는 방향성이 있습니다. 5’ 끝과 3’ 끝이라는 표현이 쓰입니다. 여기서 프라임 표시는 당의 탄소 위치를 구분하는 표기입니다. 입문 단계에서는 “핵산 사슬에는 앞뒤 방향이 있고, DNA와 RNA 합성은 보통 5’에서 3’ 방향으로 읽고 만들어진다”고 이해하면 됩니다.

염기쌍은 정보 복사의 핵심입니다

DNA 이중나선에서 A는 T와 짝을 이루고, G는 C와 짝을 이룹니다. RNA에서는 A가 U와 짝을 이룰 수 있습니다. 이런 짝짓기는 수소결합에 의해 안정화됩니다.

염기쌍 덕분에 DNA는 복제될 수 있습니다. 한 가닥의 서열을 알면 반대편 가닥의 서열을 예측할 수 있기 때문입니다. 예를 들어 한 가닥이 A-G-T-C라면 반대편은 T-C-A-G가 됩니다.

이 원리는 생물정보학에서도 중요합니다. 상보서열(complementary sequence)은 염기쌍 규칙에 따라 대응되는 서열입니다. 중합효소 연쇄반응(PCR, 특정 DNA 구간을 많이 복사하는 기술), 시퀀싱, 탐침 설계 등에서 이 원리가 계속 쓰입니다.

DNA가 RNA보다 더 안정한 이유

DNA는 보통 장기 보관용 정보 저장 분자입니다. RNA는 상대적으로 임시 작업 문서에 가깝습니다. 화학적으로도 RNA는 DNA보다 더 쉽게 분해될 수 있습니다.

그 이유 중 하나는 당의 차이입니다. RNA의 리보스에는 2’ 위치에 하이드록실기(-OH)가 있습니다. 이 작은 차이 때문에 RNA는 특정 조건에서 더 쉽게 끊어질 수 있습니다. DNA는 이 부분에 산소가 하나 적은 디옥시리보스를 사용해 상대적으로 안정합니다.

이 차이는 생물학적 역할과 잘 맞습니다. DNA는 오래 보관해야 하므로 안정적인 편이 좋습니다. RNA는 필요할 때 만들어지고 필요 없으면 분해되는 편이 유전자 발현 조절에 유리합니다.

핵산은 음전하를 가진 긴 고분자입니다

DNA와 RNA는 인산기 때문에 전체적으로 음전하를 가집니다. 이 성질은 여러 생명현상과 실험기법에서 중요합니다.

세포 안에서 DNA는 히스톤(histone, DNA를 감아 정리하는 단백질)과 함께 포장됩니다. 히스톤은 양전하를 띠는 부분이 많아 음전하를 띠는 DNA와 잘 상호작용할 수 있습니다. 이 포장 상태는 유전자 발현 조절과 후성유전학에서 중요합니다.

실험실에서는 핵산의 음전하를 이용해 전기영동을 합니다. 전기장을 걸면 DNA 조각이 이동하고, 작은 조각은 큰 조각보다 더 빨리 이동할 수 있습니다. 그래서 DNA 조각의 크기를 대략 확인할 수 있습니다.

염기 손상과 복구

DNA는 안정적이지만 완벽하게 안전한 것은 아닙니다. 자외선, 산화 스트레스, 화학물질, 복제 오류 때문에 염기가 손상될 수 있습니다. 세포에는 이런 손상을 고치는 DNA 복구 시스템이 있습니다.

DNA 복구가 제대로 작동하지 않으면 변이가 쌓일 수 있고, 이는 암 발생 위험과 연결될 수 있습니다. 예를 들어 피부세포가 자외선을 많이 받으면 DNA 손상이 증가하고, 복구가 충분하지 않으면 돌연변이가 축적될 수 있습니다.

계산생물학에서는 암 유전체에서 특정 돌연변이 패턴을 분석해 어떤 손상 과정이 작동했는지 추정하기도 합니다.

생물정보학에서 왜 이것을 알아야 할까

DNA와 RNA를 단순 문자열로만 보면 많은 것을 놓칩니다. 왜 RNA 데이터는 쉽게 분해될 수 있는 시료에서 품질 문제가 생기는지, 왜 DNA는 음전하를 띠는지, 왜 염기쌍 규칙이 복제와 시퀀싱의 기초인지 이해하려면 화학적 구조를 알아야 합니다.

또한 시퀀싱 데이터의 오류, PCR 편향, RNA 품질 저하, DNA 메틸화 분석은 모두 핵산의 화학적 성질과 연결됩니다. 계산생물학자는 컴퓨터로 데이터를 분석하지만, 그 데이터는 실제 화학 분자에서 나온 것입니다.

초보자가 놓치기 쉬운 중간 다리: 핵산은 방향이 있는 분자입니다

핵산 서열을 컴퓨터 화면에서 보면 ATGCC...처럼 단순한 글자열로 보입니다. 하지만 실제 분자에서는 글자들이 아무 방향 없이 놓여 있지 않습니다. 핵산 사슬에는 5’ 끝과 3’ 끝이 있습니다. 이 방향성 때문에 “같은 글자 배열”이라도 어느 방향으로 읽는지가 중요합니다.

예를 들어 A-G-T-C라는 DNA 가닥의 상보서열은 T-C-A-G입니다. 하지만 실제 이중가닥 DNA에서는 두 가닥이 서로 반대 방향으로 놓입니다. 그래서 생물정보학에서는 단순 상보서열뿐 아니라 역상보서열(reverse complement)도 매우 자주 씁니다. 역상보서열은 먼저 염기쌍을 바꾼 뒤, 방향을 거꾸로 뒤집어 읽는 서열입니다.

예를 들어 5’-A G T C-3’의 상보 염기는 T C A G입니다. 그런데 반대 가닥을 같은 5’→3’ 방향으로 쓰면 G A C T가 됩니다. 이것이 역상보서열입니다. PCR primer 설계, read mapping, 유전체 변이 확인에서 이 차이를 모르면 방향을 반대로 해석하는 실수를 하게 됩니다.

GC 함량은 단순한 비율이 아니라 안정성과 실험 조건을 바꾸는 단서입니다

GC 함량은 전체 염기 중 G와 C가 차지하는 비율입니다. 예를 들어 A G G C T C는 전체 6개 중 G 또는 C가 4개이므로 GC 함량은 4/6, 즉 약 66.7%입니다. G-C 염기쌍은 A-T 염기쌍보다 수소결합이 더 많아 일반적으로 더 안정합니다.

이 말은 “GC가 많으면 무조건 좋다”는 뜻이 아닙니다. GC가 너무 높으면 DNA 가닥이 잘 벌어지지 않아 PCR이 어려워질 수 있고, GC가 너무 낮으면 primer가 약하게 결합할 수 있습니다. 그래서 생물정보학에서 primer를 설계하거나 sequencing read의 품질을 볼 때 GC 함량은 기본 점검 항목이 됩니다.

데이터 해석 관점: 핵산 화학은 FASTA 파일 뒤에 숨어 있습니다

FASTA 파일에는 서열만 보입니다. 하지만 그 서열은 실제로 음전하를 띠는 긴 고분자에서 나온 데이터입니다. RNA-seq 데이터의 품질이 낮다면 단순히 “파일이 나쁘다”가 아니라 RNA가 분해되었는지, 시료 보관이 적절했는지, rRNA 제거가 잘 되었는지까지 생각해야 합니다.

DNA-seq에서도 마찬가지입니다. 특정 염기가 반복되는 구간, GC가 지나치게 높은 구간, 손상되기 쉬운 염기 패턴은 sequencing 오류나 mapping 오류와 연결될 수 있습니다. 계산생물학자는 코드를 쓰지만, 데이터의 출발점이 화학 분자라는 사실을 잊으면 오류의 원인을 잘못 짚게 됩니다.

초보자가 자주 하는 오해

첫째, DNA를 단순한 글자열로만 생각하는 오해가 있습니다. 분석에서는 글자열처럼 다루지만, 실제로는 방향성, 전하, 안정성, 손상을 가진 분자입니다.

둘째, 상보서열과 역상보서열을 같은 것으로 보는 오해가 있습니다. 상보서열은 염기쌍만 바꾼 것이고, 역상보서열은 생물학적 방향까지 맞추기 위해 뒤집어 쓴 것입니다.

셋째, GC 함량이 높으면 항상 좋다고 생각하는 오해가 있습니다. GC 함량은 안정성에 영향을 주지만, 너무 높거나 낮으면 실험과 분석 모두에서 문제를 만들 수 있습니다.

다음 개념과의 연결

핵산을 이해하면 다음 단계에서 아미노산과 단백질을 더 잘 이해할 수 있습니다. DNA와 RNA의 염기서열은 결국 단백질 서열로 번역됩니다. 따라서 핵산의 화학은 단백질 기능, 변이 해석, 유전자 발현 분석으로 이어지는 첫 출발점입니다.

핵심 정리

핵산은 DNA와 RNA처럼 유전 정보와 관련된 생체분자입니다. 핵산의 기본 단위는 뉴클레오타이드이며, 뉴클레오타이드는 당, 인산기, 염기로 이루어집니다. 인산다이에스터 결합은 뉴클레오타이드를 이어 긴 사슬을 만들고, 염기쌍은 정보 복사와 상보서열의 기초가 됩니다. DNA는 RNA보다 상대적으로 안정하고, RNA는 더 임시적인 정보 사용에 적합합니다. 핵산의 화학을 이해하면 시퀀싱, PCR, 전기영동, 유전자 발현 분석을 더 깊게 이해할 수 있습니다.

문제 풀이

핵산의 화학

0 / 17
Gemini AI 채점

주관식 답안은 Gemini API로 채점합니다. API 키는 이 브라우저에만 저장됩니다.

API KEY 미등록
  1. 1. [쉬움] 객관식

    뉴클레오타이드의 구성으로 가장 적절한 것은?

    선택지
  2. 2. [보통] 객관식

    DNA 서열 5’-AGTC-3’의 역상보서열을 같은 5’→3’ 방향으로 쓴 것은?

    선택지
  3. 3. [계산] 객관식

    서열 AAGGCTCC의 GC 함량으로 가장 적절한 것은?

    선택지
  4. 4. [보통] 객관식

    RNA가 DNA보다 더 쉽게 분해될 수 있는 화학적 이유로 가장 적절한 것은?

    선택지
  5. 5. [보통] 객관식

    핵산이 전기영동에서 이동할 수 있는 주된 이유는?

    선택지
  6. 6. [어려움] 객관식

    PCR primer 설계에서 5’/3’ 방향성을 무시하면 생길 수 있는 문제로 가장 적절한 것은?

    선택지
  7. 7. [계산] 객관식

    DNA 조각 5’-ATGCGC-3’에서 G-C 염기쌍에 해당할 수 있는 염기의 비율은?

    선택지
  8. 8. [보통] 객관식

    “GC 함량이 높으면 항상 실험에 좋다”는 말이 부정확한 이유는?

    선택지
  9. 9. [쉬움] 객관식

    DNA에서 A와 주로 짝을 이루는 염기는?

    선택지
  10. 10. [보통] 객관식

    RNA-seq 시료 품질이 낮을 때 핵산 화학 관점에서 먼저 의심할 수 있는 것은?

    선택지
  11. 11. [보통] 객관식

    상보서열과 역상보서열의 차이로 가장 적절한 것은?

    선택지
  12. 12. [어려움] 객관식

    암 유전체에서 특정 돌연변이 패턴을 분석하는 일이 핵산 화학과 연결되는 이유는?

    선택지
  13. 주관식 13. [보통] 주관식 · Gemini 채점

    핵산을 단순 문자열이 아니라 화학 분자로 이해해야 하는 이유를 설명하라.

  14. 주관식 14. [보통] 주관식 · Gemini 채점

    상보서열과 역상보서열의 차이를 예시와 함께 설명하라.

  15. 주관식 15. [어려움] 주관식 · Gemini 채점

    GC 함량이 PCR이나 sequencing 해석에서 중요한 이유를 설명하라.

  16. 주관식 16. [보통] 주관식 · Gemini 채점

    RNA가 DNA보다 임시 작업 문서에 가깝다고 말할 수 있는 이유를 설명하라.

  17. 주관식 17. [어려움] 주관식 · Gemini 채점

    암 유전체 분석에서 핵산 손상과 복구 개념이 필요한 이유를 설명하라.