基因的編碼區(英語:Coding region),亦稱為「編碼序列」(Coding sequence)或「CDS」(Coding DNA Sequence),是指DNARNA中由外顯子組成,編碼蛋白質的部分。該區域的邊界範圍從靠近5′末端起始密碼子開始,到靠近3′末端終止密碼子為止。mRNA的編碼區範圍位於5′非轉譯區和部分同樣為外顯子的3′非轉譯區之間。[1]

某個生物體的編碼區是指該生物由基因編碼區組成的基因組的總和。[2]

編碼序列註釋

編輯

雖然識別DNA序列內的開放閱讀框簡單明了,但識別編碼序列卻並非如此,因為細胞只會把所有開放閱讀框的一部分轉譯為蛋白質。[3]目前CDS預測透過對細胞mRNA取樣測序完成,但要判斷給定mRNA究竟哪一部分實際轉譯為了蛋白質,目前仍是問題。CDS預測屬於基因預測的一部分,後者不僅包括對編碼蛋白質的DNA序列預測,也包括對其它功能元件,如RNA基因和調節序列的預測。

參見

編輯

參考文獻

編輯
  1. ^ Twyman, Richard. Gene Structure. The Wellcome Trust. 1 August 2003 [6 April 2003]. (原始內容存檔於2007年3月28日). 
  2. ^ Goto, Mami; et al. Analysis of CpG Dinucleotide Frequency in Bacterial Genomes with Respect to Genomic Regions and Codon (PDF). The Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan. April 8, 2000 [6 April 2009]. (原始內容 (PDF)存檔於2003年6月22日). 
  3. ^ Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi. CDS Annotation in Full-Length cDNA Sequence (PDF). Genome Research (Cold Spring Harbor Laboratory Press). September 2011, 21 (9): 1478–1487 [18 September 2011]. doi:10.1101/gr.1060303. (原始內容 (PDF)存檔於2019-10-01).