동명의 이름을 가진 개그콘서트의 코너에 대한 내용은 유행어를 전파하는 자 문서 참고하십시오.
1. 개요
遺傳子 / Gene자가 복제가 되는 성질의 분자 조합물이자 부모가 자식에게 특성을 물려주는 현상인 유전을 일으키는 단위이다. 건물을 짓기 위해 설계도가 필요하듯, 생명체가 몸을 구성하기 위해서는 설계 정보가 필요하며 생명체 내에서 이 설계도에 해당하는 것이 바로 유전자이다.
유전자라는 개념 자체는 DNA 발견 이전부터 있었던, 보다 큰 개념이다. 즉 유전자 안에 DNA가 포함된다. 그런데 유전에 DNA의 역할이란 대단히 크므로 여기서는 DNA 중심으로 서술한다.
2. 구조
유전자는 DNA상의 염기 배열 방식으로, DNA의 성분인 네 가지 염기 아데닌(A), 구아닌(G), 사이토신(C), 타이민(T)이 DNA에서 어떤 순서로 배열되었는지에 따라 유전 정보를 저장한다. 결국 유전자란, 쉽게 말해 4종류 알파벳(A, G, C, T)으로 이루어진 '4진법' 설명문이라고 볼 수 있다. 기록 매체인 카세트테이프에 비유하자면, DNA는 카세트 테이프의 자기 테이프, 유전자는 자기 테이프 상의 자기 배열 상태에 해당한다.[1]다만, 유전자의 모든 부분이 곧 유전 정보를 담고 있는 것은 아니다. 우리가 일상에서 알파벳을 무작위로 섞어 글자의 나열을 만든다고 그것이 곧 유의미한 문장이 되는 것이 아니듯, 유전자도 4가지 염기 A, G, C, T가 체계적으로 나열되어야 비로소 설계도로서의 의미를 가지게 된다. 이렇게 염기들이 체계적으로 나열되어 mRNA로 전사되며 단백질을 번역하는 정보를 담고 있는 유전자 부위를 엑손, mRNA로 전사되지 않고 Splicing 되는 유전자 부위를 인트론이라고 한다. 대부분의 진핵생물의 DNA에는 인트론이 존재하고 복잡한[2] 진핵생물일 수록 인트론의 수가 많아진다. 사람의 경우, DNA의 약 24%가 인트론이고 엑손은 고작 1.1-2%에 불과하다.#
3. 기능
생명체는 유전 정보를 토대로 신체를 형성하고 고유의 형질을 발현하는데 유전자는 이 과정에서 특정한 단백질의 합성을 위한 설계도의 기능을 한다. 유전자는 염기 3개를 한 단위으로 하는 코돈이라는 암호 체계를 통해 각각의 아미노산을 지정하며[3], 이 유전자를 기초로 만들어진 아미노산 다발은 복잡한 가공 과정을 거쳐 단백질로 합성되고 이는 신체의 각 조직과 기관을 구성하는 성분이 된다. 이러한 유전자의 발현 과정을 센트럴 도그마라고 한다.사람에게는 약 2만 ~ 2만 5천 개의 유전자가 있는데 이 중 어떤 유전자는 눈을 만드는 데 관여하고 또 어떤 유전자는 심장을 만드는데 관여하는 등, 각각의 유전자마다 고유의 역할과 기능이 존재한다. 여기서 중요한 것은 한 개체의 모든 세포는 모조리 동일한 유전자의 집합을 가지고 있다는 것이다.[4][5] 따라서 각각의 세포는 수많은 유전자들 중 자신의 역할에 맞는 것만을 활성화시키고 그렇지 않은 것들은 불활성화시키게 되는데,[6] 이 과정이 과연 어떻게 가능한지가 유전학에서의 주된 관심사이다. 지금까지 밝혀진 바에 따르면 정크 DNA라고 불렸던 비암호화 dna 지역이 유전자 발현에 주된 영향을 끼치는 것으로 보이며 유전자 중에는 다른 유전자의 발현 여부를 통제하는 조절 유전자라는 것이 있으며, 이 조절 유전자가 생성한 단백질에 의해 다른 유전자의 발현이 촉진되거나 방해받는 복잡한 기전이 일어나면서 생물의 특성이 적절한 부위에서 적절한 시기에 나타나도록 통제된다고 한다. 물론 이 이론만으로는 설명할 수 없는 것이 많으며, 따라서 유전자 발현의 조절은 아직 밝혀져야 할 것이 많은 미스터리라 할 수 있겠다.
4. 유전 현상
모든 생물체는 세포로 이루어져 있고 이 세포의 핵에 염색사가 들어있는데 이것이 감수 1분열 전기에 염색체로 응축이 된다, 이후 상동염색체가 분리되고 염색분체가 분리되면서 핵상은 2n에서 n이 되고 DNA양은 절반이 된다. 이것에 부모의 유전자가 들어가면서 복제되어 다음 세대로 이어지는 것이다.유전자가 어디에 위치하느냐에 따라 두 가지로 나눌 수 있다. 성염색체에 위치하면 성 연관 유전자(반성 유전자,sex-linked gene)로 아니면 유전자(autosomal gene)로 불린다. 한편 한성 유전자(sex-limited gene)란 것도 있는데, 이 유전자는 상염색체 유전자지만 특정 성별에서만 발현된다.[7]
유전자를 통해 부모의 형질이 자식에게 그대로 유전되지만 부모의 사소한 버릇이나 습관까지 유전된다. 외로움[8], 사회적 성향[9], 외국어 학습 속도[10]는 물론이고, 심지어 TV보는 습관까지[11] 유전된다. 이 경우들에서는 유전자를 통해 자녀에게 전달한 것보다도 인간이 부모의 습관은 따라하려는 본능에 의한 환경유전의 영향이 클 가능성이 매우 높다. 즉, 사고방식 습관 능력 잠재력 지능 노력 등등 많은 부분에서 유전자와 환경적 유전이 관련되어 있다.
5. 역사
유전자에 대한 개념을 처음 제시한 과학자는 오스트리아의 가톨릭 수도사제였던 그레고어 멘델(G. J. Mendel)이다. 멘델은 완두콩을 이용한 실험을 통해 멘델의 법칙을 발견함으로써 유전 원리를 처음 과학적으로 밝혀내고 유전자의 존재를 추정하여 이에 대한 가설[12]을 세웠다. 멘델은 이러한 결과를 1865년에 발표했으나, 그 당시에는 큰 반응을 불러일으키지 못해 이슈가 터지진 못했고, 1884년에 멘델이 사망한 후 16년이 지난 1900년에 코렌스(C. Correns), 체르마크(E. V. Tschermak), 드 브리스(H. de Vries)라는 세 명의 과학자가 같은 시기에 멘델의 연구를 다시 발견하여 멘델의 업적은 세상에 알려졌다. 멘델의 법칙이 알려진 후 과학자들은 실제로 멘델이 예상했던 유전 물질이 무엇인지를 찾아내는 데 집중했다. 그리고 1903년 서튼(W. S. Sutton)은 곤충에서 염색체가 정자와 난자에서 둘로 쪼개졌다 수정될 때 하나로 합쳐지는 현상을 관찰하고 멘델이 추정한 유전 인자가 염색체에 있다는 사실을 검증했다.1909년에는 이 유전인자에 요한센(W. Johannsen)이 유전자라는 이름을 처음으로 사용하였다. 그리고 개념상으로만 존재하던 유전자는 모건(T. H. Morgan)의 초파리 실험에 의해 확실히 염색체에 있다는 것이 확인된다. 1928년에는 그리피스(F. Griffith)가 폐렴쌍구균을 이용하여 형질전환 실험을 하여 유전자의 존재[13]를 확인하고, 이 실험 방식을 이어받아 1943년에 에이버리(O. T. Avery)가 DNA를 따로 분리한 형질전환 실험을 한다. 이 실험을 통해 에이버리는 DNA가 유전자를 구성하는 물질이라는 것을 주장하지만 아직 이 당시에는 단백질설이 더 일반적으로 받아들여지고 있었다. 그러다가 1952년에 허시(A. Hershey)와 그 제자 체이스(M. Chase)가 박테리오파지를 이용한 실험을 하여 유전자의 본체가 DNA라는 사실을 거의 확정적으로 만들게 된다. 표식을 붙인 박테리오 파지의 DNA는 박테리오 파지에서 대장균으로 옮겨갔지만, 표식을 붙인 단백질은 옮겨가지 않았던 것. 이후 1953년에 왓슨(J. D. Watson)과 크릭(F. Crick)이 DNA의 이중나선 구조를 밝히면서 현재와 같은 유전자의 개념이 거의 확립되었다.
6. 유전자 명명법
유전자 명은 발견자가 붙일 수 있다. 해당 유전자를 처음 발견한 논문에서 붙인 이름을 보통 공식 유전자 명으로 사용한다. 그래서 재미있는 유전자 명이 많이 있다. 한국어로 된 유전자 명도 있다! 하지만 최근에는 NCBI 등 DB 에 올라와 있는 이름 없는 유전자들에 대해서, 타 종의 annotation[14]된 유전자와의 상동(Homology) 등을 분석하여 예측되는 기능에 관한 이름을 붙여버리고 있다.유전자 명명법 가이드라인은 1987년, 1995년, 1997년에 계속 개정되면서 오늘날에는 인간 유전자 명명법 위원회(HUGO Gene Nomenclature Committe)가 새로 규명되는 유전자를 승인하고, 유전자 기호(gene symbol, 遺傳子記號)를 결정하는 권한을 가진다. 현재는 인간 유전체 서열(sequence)이 완전히 규명되는 단계에 접어들었는데, International Human Genome Sequencing Consortium (IHGSC)에서 추정하는 유전자는 총 26,000-40,000 개이다.# 최근에는 알파벳+숫자 조합의 유전자 명명 방식이 많이 사용되는데, 크게 다음과 같은 명명 방식이 있다고 한다.#
- 해당 유전자가 처음 발견된 Mutant의 이름 따라가는 방법 (예: Shaker, Spire…)
- 단백질이 처음 발견될 경우 단백질의 size 따라 (예: p53, p300)
- 지놈 시퀀싱이나 스크리닝에 의해서 발견된 경우 그냥 순서별로 (cdc42, vpa1370…)
- 해당하는 유전자, 단백질의 기능에 대한 약자.
- 기존에 알려진 단백질/유전자와의 상동성에 다른 구분.
- 유전자 기호는 라틴 문자(Latin letters), 이탤릭체 대문자로 표기한다. 그러나 생명체마다 표기방법이 다른데, 예를 들어 마우스일 경우 첫 글자만 대문자로, 그 뒤부터는 소문자 이텔릭체로 표기하며 바이러스는 모두 소문자로 표기한다. 유전자 산물인 단백질은 보통체(눕히지 않은 정자)로 표기한다.
- 라틴문자와 아라비아 숫자(Arabic numerals)를 조합하여 표기할 수 있으나 첫 글자는 항상 라틴문자이다. 로마 숫자로 표기했던 경우 아라비아 숫자(Arabic equivalents)로 고쳐져야 한다.
- 유전자 기호는 효용성을 갖기 위해서는 짧아야 하고, 특정 유전자에 관한 모든 정보를 갖도록 시도해서는 안 된다. 데이터 검색에 혼란을 줄 수 있는 단어가 되어서도 안 된다. 라틴문자의 길이는 6자를 넘지 않아야 하며 새로운 유전자 기호는 기존의 기호와 중복되어서는 안 된다.
- HLA, immunoglobulin, T cell receptor 유전자에서 하이펀(hypen)을 쓰는 경우가 있고 통상적으로는 마침표(no punctuation)를 사용하지 않는다. 또한 유전자(gene)을 의미하는 "G" 글자는 표함되지 않아야 한다. HLA 유전자를 표기할 때는 WHO Nomenclature Committee for Factors of the HLA System의 규칙에 따른다.
- 표준형 또는 야생형(wild type) 유전자는 +로 표시한다. +를 이에 대응되는 유전자기호의 오른쪽 상단에 붙이거나 +의 오른쪽 상단에 대응되는 유전자기호를 붙이거나 또는 +만을 사용하거나 어느 것이라도 무방하다.
- 세균 등은 이탤릭체 알파벳의 3문자, 예를 들서 아르기닌 생합성계의 유전자를 arg로 표현하고, 그 형질에 관여하는 각 유전자는 argA, argB 등으로 나타낸다. 각 유전자의 야생형(wild type)을 +, 변이형(mutant type)을 -로 표현하고, 각 돌연변이에는 번호(argA-1, argA-2 등)를 붙인다.
- 암유전자에서는 이름 앞에는 세포성을 의미하는 "c", 바이러스를 의미하는 "v"를 붙이기도 한다.(예: C-SRC 유전자, 그리고 c-Src 단백질, 또는 c-Myc 단백질)
- 같은 유전자라 하더라도 유전자명과 유전자 기호가 바뀌는데, 논문의 저자는 가장 최근의 유전자 이름과 기호를 사용해야 한다.
6.1. 이름이 한국어인 유전자 목록
- 주당 - JUDANG, 해당 논문
- 살모신 - SALMOSIN, VTN 해당 논문 pubmed
- 동글 - DONGLE, DGL 유전자가 기능을 못 하면, 애기장대의 잎이 길어지지 않고 동그란 모양이 된다. 해당 논문 pubmed
7. 관련 문서
- DNA: 유전자를 담고 있는 분자
- 본능
- 성적 매력
- 성형수술
- 센트럴 도그마: DNA에 보관된 유전자가 실제 형질로 발현되는 과정을 설명하는 이론
- 외모
- 우생학
- 유전공학
- 유전병
- 유전자 검사
- 이기적 유전자
- 중합 효소 연쇄 반응(PCR)
- 텔로미어
[1] 참고로 카세트 테이프 자체에 해당하는 것이 바로 염색체. 염색체는 DNA가 뭉쳐서 만들어지므로 그럴 듯한 비유이다.[2] 대부분의 경우 고등한[3] 생명체가 단백질 합성에 사용하는 아미노산은 20여 종이며 아미노산을 지정하기 위해 사용하는 기호(염기)의 종류는 4종이다. 염기 2개로 표현 가능한 정보의 종류는 최대 4^2 = 16가지이므로 모든 아미노산을 지정하기에 부족하고, 염기 3개로 표현 가능한 정보의 종류는 최대 4^3 = 64가지이므로 모든 아미노산을 지정하기에 충분하다. 따라서 생물은 염기 3개가 하나의 아미노산을 지정하는 암호 체계를 진화시켰다. 자세한 것은 코돈 항목 참조.[4] 예컨대, 신경 세포는 신경 세포의 설계도 뿐만 아니라 근육 세포, 심장 세포, 피부 세포 등의 설계도도 모조리 가지고 있다.[5] 단, 정자와 난자 등 생식 세포는 예외다. 이들은 체세포 유전자의 절반만을 가진다.[6] 이러한 과정이 없다면 우리는 손바닥에서 눈알이 생겨나고 심장에서 머리털이 돋아나는 광경을 보게 된다. 이 활성화/불활성화 과정에 문제가 생겨서 실제로 기관을 마구잡이로 생성한 조직을 기형종이라고 부른다.[7] 이상 Kalat,'생물심리학',김문수 외 역,박학사,2014,pp12-13[8] McGuire, S., & Clifford, J. (2000). Genetic and environmental contributions to loneliness in children. Psychological Science, 11(6), 487-491[9] Posner, S. F., Baker, L., Heath, A., & Martin, N. G. (1996). Social contact, social attitudes, and twin similarity. Behavior genetics, 26(2), 123-133.[10] Dale, P. S., Harlaar, N., Haworth, C. M., & Plomin, R. (2010). Two by two: A twin study of second-language acquisition. Psychological Science, 21(5), 635-640.[11] Plomin, R., Corley, R., DeFries, J. C., & Fulker, D. W. (1990). Individual differences in television viewing in early childhood: Nature as well as nurture. Psychological Science, 1(6), 371-377[12] 각각 유전자의 다양성을 알려주는 대립 유전자, 부모로부터 각각 하나씩 물려받는 유전 형질, 대립 유전자 중 모양이 드러나는 것은 우성이며 그렇지 않은 것은 열성, 유전되는 특징의 두 대립 유전자는 서로 자손을 낳을 때 분리되며 그 자손들에게 들어간다.[13] 이것은 후에 개념이 확립되는 '수평적 유전자 이동'을 확인한 것이다. 수평적 유전자 이동은 다른 유기체 사이의 유전자 교환을 뜻한다.[14] 전체 게놈에서의 부호화한 유전자와 유전체의 위치를 식별하는 과정.