基因的编码区(英语:Coding region),亦称为“编码序列”(Coding sequence)或“CDS”(Coding DNA Sequence),是指DNARNA中由外显子组成,编码蛋白质的部分。该区域的边界范围从靠近5′末端起始密码子开始,到靠近3′末端终止密码子为止。mRNA的编码区范围位于5′非翻译区和部分同样为外显子的3′非翻译区之间。[1]

某个生物体的编码区是指该生物由基因编码区组成的基因组的总和。[2]

编码序列注释

编辑

虽然识别DNA序列内的开放阅读框简单明了,但识别编码序列却并非如此,因为细胞只会把所有开放阅读框的一部分翻译为蛋白质。[3]目前CDS预测通过对细胞mRNA取样测序完成,但要判断给定mRNA究竟哪一部分实际翻译为了蛋白质,目前仍是问题。CDS预测属于基因预测的一部分,后者不仅包括对编码蛋白质的DNA序列预测,也包括对其它功能元件,如RNA基因和调节序列的预测。

参见

编辑

参考文献

编辑
  1. ^ Twyman, Richard. Gene Structure. The Wellcome Trust. 1 August 2003 [6 April 2003]. (原始内容存档于2007年3月28日). 
  2. ^ Goto, Mami; et al. Analysis of CpG Dinucleotide Frequency in Bacterial Genomes with Respect to Genomic Regions and Codon (PDF). The Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan. April 8, 2000 [6 April 2009]. (原始内容 (PDF)存档于2003年6月22日). 
  3. ^ Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi. CDS Annotation in Full-Length cDNA Sequence (PDF). Genome Research (Cold Spring Harbor Laboratory Press). September 2011, 21 (9): 1478–1487 [18 September 2011]. doi:10.1101/gr.1060303. (原始内容 (PDF)存档于2019-10-01).