MYC基因家族包括B-MYC、L-MYC、N-MYC、S-MYC和MYC等。MYC基因家族及其产物可促进细胞增殖、永生化、去分化和转化等,在多种肿瘤形成过程中处于重要地位。MYC是1997年发现的一种癌基因,其表达的MYC蛋白是一种涉及细胞增殖、分化以及凋亡等生物学进程的转录因子,参与调节人类15%的基因。细胞内MYC基因的表达常受到某些生长因子刺激的诱导,因而被认为是有丝分裂信号在细胞内的中介物。MYC蛋白是一种富含脯氨酸的磷酸化蛋白,存在于细胞核内。MYC原癌基因扩增与肿瘤形成及发展和转移关系密切,在胃癌、肺癌、宫颈癌、乳腺癌等多种肿瘤中呈现高表达状态。
1 材料与方法
1.1 材料
人与大鼠、果蝇、家犬、猪、牛、羊,白簇耳狨猴、黑猩猩、树鼩、斑鼯猴的MYC蛋白氨基酸序列。从uniport上下载人或其他物种MYC蛋白氨基酸序列。以人MYC蛋白序列为例:
>sp|P01106|MYC_HUMAN Myc proto-oncogene protein OS=Homo sapiens GN=MYC PE=1 SV=1
MPLNVSFTNRNYDLDYDSVQPYFYCDEEENFYQQQQQSELQPPAPSEDIWKKFELLPTPP
LSPSRRSGLCSPSYVAVTPFSLRGDNDGGGGSFSTADQLEMVTELLGGDMVNQSFICDPD
DETFIKNIIIQDCMWSGFSAAAKLVSEKLASYQAARKDSGSPNPARGHSVCSTSSLYLQD
LSAAASECIDPSVVFPYPLNDSSSPKSCASQDSSAFSPSSDSLLSSTESSPQGSPEPLVL
HEETPPTTSSDSEEEQEDEEEIDVVSVEKRQAPGKRSESGSPSAGGHSKPPHSPLVLKRC
HVSTHQHNYAAPPSTRKDYPAAKRVKLDSVRVLRQISNNRKCTSPRSSDTEENVKRRTHN
VLERQRRNELKRSFFALRDQIPELENNEKAPKVVILKKATAYILSVQAEEQKLISEEDLL
RKRREQLKHKLEQLRNSCA
1.2 方法
1.2.1 MYC氨基酸组成分析
利用Amino Acid composition进行MYC基因氨基酸组成分析。Amino Acid composition一个给定的储存蛋白参数计算Swiss-Port和TrEMBL或用户输入的蛋白序列从而计算氨基酸组成,并给出组成的比例柱状图。
1.2.2 系统发育分析(分子进化分析)
MYC系统发育分析使用MEGA(版本5.2)软件进行。MEGA是一款非常流行的系统发育树分析软件,可以根据用户所提供的氨基酸序列,通过不同算法对提交的氨基酸序列进行分子进化分析,并将结果以图示化的进化树形式呈现。
1.2.3 MYC蛋白三级结构预测
利用SWISS-MODEL进行MYC三级结构预测。SWISS-MODEL是一个基于网页形式的自动化的蛋白质结构同源建模服务器,采用同源建模(比较建模)方法构建蛋白质结果。该方法包括:(1)搜索与目标蛋白序列相似的模板蛋白;(2)BLAST搜索;(3)目标序列与模板序列比对;(4)ClustalW/X;(5)建立骨架(将模板结构叠加起来,找结构模板保守区域)。
2 结果与分析
2.1 氨基酸组成分析
图1 MYC蛋白的氨基酸组成占比图
氨基酸组成分析(见图1);占比大于5.0%,即含量高于平均值的有丝氨酸(Ser,S),亮氨酸(Leu,L),谷氨酸(Glu,E),丙氨酸(Ala,A),天冬氨酸(Asp,D),赖氨酸(Lys,K),精氨酸(Arg,R),颉氨酸(Val)。最高比例的是丝氨酸(Ser,S),占比14.35%;最低比例的是色氨酸(Trp,W),占比0.46%。根据特定高含量氨基酸对应氨基酸的亲疏水性,得出该蛋白质呈现较为明显的亲水性特点。
2.2 系统发育分析(进化分析)
图2 MYC蛋白在包括人在内的11个物种的进化树
为了探明MYC蛋白在不同物种之间的进化关系,进行MYC蛋白分子进化分析(见图2)。最有可能的进化树根据亲缘关系将不同物种进行分类,每个大类下还有相应小类。数值越大,表明预测的亲缘关系越可靠。本次的材料选用了人、大鼠、果蝇、家犬、猪、牛、羊、白簇耳狨猴、黑猩猩、树鼩、斑鼯猴。根据上图分析,牛和羊的亲缘关系高度相近,人和黑猩猩的亲缘关系高度相近,白簇耳狨猴和斑鼯猴的亲缘关系高度相近,推测是因为都是灵长类进化而来所保存的高度相似性。猪、树鼩、果蝇和家犬的值小于40,说明三者的亲缘关系相距较远。
2.3 三级结构预测
选用SWISS-MODEL提供的MODEL01(此模板为MYC-DNA结合的三级结构数据,pdb格式),通过同源模建方法对MYC蛋白结构进行预测。3D结构如图3所示
图3 MYC蛋白三级结构的四种图形化显示
为了检查构建的蛋白结构是否准确,对3D结构进行建模质量评估。结果得知,SWISS-MODEL对MYC蛋白的约350~440个氨基酸与模板的总体相似性较高,说明前后预测结果比较准确;380~390区间相似值相对较低,所以预测准确性偏低。总体模型评估(GMQE)数值为0.8,整体模型预测分析较为准确。
参考文献
[1]邓景岳,毕明刚.影响原癌基因cMYC作用因素的研究进展[J].肿瘤,2009,(12).
[2]陈善萍,王俊利,韦贵将.肿瘤分子标志物MYCMYC基因的研究进展[J].2016,(2).
[3]夏顺汉,张玉砚.MYCMYC基因表达调控及其功能研究进展[J].细胞生物学杂志,1988,(4).
[4]Nair R,RodenDL,Teo WS,et al.MYCMYC and Her2 cooper-ate to drive a stem like phenotype with poor prognosis in breast cancer[J].Asian Pac JCancer Prev,2015,16(16).
[5]Apweiler R,Bairoch A,Wu C H,et al.UniP rot:the universal protein knowledge base[J].Nucleic Acids Res,2004,32(1).
(成都玉林中学)