APP下载

乳腺癌高表达基因FAM83A的生物信息学分析*

2013-08-24车清海赵恩宏程露阳肖丽君

重庆医学 2013年3期
关键词:文库标签乳腺

刘 镭,黄 亮,车清海,赵恩宏,黄 旭,程露阳,肖丽君

(1.承德医学院基础医学部免疫教研室,河北 承德 067000;2.承德医学院附属医院肿瘤诊治中心,河北 承德 067000;3.吉林市龙潭区妇幼保健院妇产科 132000)

乳腺癌是严重威胁妇女健康的恶性肿瘤,发病率已跃居国内妇女癌症发病首位[1]。X线片筛查受影像学特点的制约,使很多患者失去了早期发现的机会[2]。筛查肿瘤生物标记物对乳腺癌的早期发现具有重要意义,成为目前研究的主要焦点[3]。随着生物数据的急剧增长和计算机技术的快速提高,生物信息学这一新兴学科得到了前所未有的迅速发展,尤其是应用生物信息学方法发现新基因和进行功能研究[4]。本文通过肿瘤基因组解剖计划(cancer genome anatomy project,CGAP)基因表达系列分析(SAGE)数据库,全面分析肿瘤组织基因表达谱,筛选新的乳腺癌高表达基因,并对其中一条功能未知的新基因FAM83A进行了初步的生物学分析,为进一步深入研究该基因的生物学功能及其参与乳腺癌发生发展的分子机制奠定了基础。

1 材料与方法

1.1 材料 乳腺癌细胞系MDA-MB-231和MCF-7来自承德医学院中心实验室。承德医学院附属医院收集5例乳腺癌手术切除标本(均经术后病理证实),相应的距癌灶边缘2cm以外的癌旁组织,以及5例乳腺纤维瘤组织,各约100mg。标本装入无菌管内,迅速投入液氮罐内冷冻。

1.2 方法

1.2.1 差异基因的筛选 利用CGAP提供的SAGE Genie数据库,选取数字基因表达演示工具。选择乳腺癌组织和乳腺良性肿瘤两个池,设置F值为2,即表达差异大于2倍以上;Q为0.1。差异表达的基因按差异显著性高低排序,比对出在短、长序列标签文库中都出现的差异基因。并对其中一条功能未知的高表达序列FAM83A进行初步的生物信息学分析。

1.2.2 序列比对 利用BLAST软件检索EST数据库、nr数据库及pro数据库。将所克隆的基因核苷酸序列与GeneBank中已知核苷酸序列进行同源性分析。氨基酸序列相似性分析用NCBI/blastp,多序列比对和进化树分析用clustal W。

1.2.3 理化性质和亚细胞定位 对蛋白质分子量、等电点、疏水性等理化性质分析,用 ExPASy-protparam 工具。用PSORTⅡ服务程序进行亚细胞定位预测。

1.2.4 蛋白质结构预测 ELM预测蛋白质功能性位点(http://elm.eu.org/)[5]。信号肽及剪切位点预测用 SignalIP。二级结构预测应用SOPMA工具。保守结构域用NCBI/CDD预测。

1.2.5 电子表达谱分析 以FAM83A为关键词,通过Uni-Gene库中的EST表达情况分析获得FAM83A基因电子表达谱。

1.2.6 半定量RT-PCR验证性实验 TRIZOL法提取乳腺癌细胞系、乳腺癌、癌旁、乳腺纤维瘤组织总RNA,按逆转录试剂盒(QIAGEN)操作步骤进行逆转录。PCR反应体系25μL,其中包括2.5μL cDNA模板,2.5μL 10×PCR反应缓冲液,0.5μL dNTP(10mmol/L),0.5μL Taq DNA 聚合酶,上下游引物各0.5μL。FAM83A 上游引物为:5′-TAG AGG CAG CCA ACA AGC GTG-3′;下游引物为:5′-CCT TTG GAA AGC TGG GCT TGG GAG-3′。反应条件为94 ℃,15s;60℃,30s;72 ℃ 1min,30个循环。以甘油醛-3-磷酸脱氢酶(GAPDH)作为反应内参。取10μL PCR产物,在1%琼脂糖凝胶上进行电泳检测。

2 结 果

2.1 乳腺癌高表达基因的筛选 最终筛选出33个在乳腺癌中高表达的基因,它们多数在Gene Bank中都被详细注释,并从中选取一条功能未知的明显高表达的基因FAM83A。选择短标签序列搜索后结果显示,在38个乳腺癌短序列标签文库中,有31个文库具有FAM83A代表标签(ATGTACAGGT),共出现1 575次。而在7个良性乳腺肿瘤短序列标签文库中,有2个文库出现该代表标签,表达差异为7.46倍。同时,在23个乳腺癌长序列标签文库中,有20个文库具有FAM83A代表标签(ATGTACAGGTTTGTAGC),共出现964次。而在5个良性乳腺肿瘤长序列标签文库中,只有一个文库出现该代表标签,表达差异为3.14倍。

2.2 FAM83A在GeneBank中的序列比对结果及不同剪接体组成 应用BLAST工具比对,发现共有6条序列与FAM83A高度同源,多为人类新mRNA序列。其中发现两条序列是FAM83A的转录变异体,GeneBank登录号分别为NM_207006.1和 NM_032899.4,加上最初发现的转录变异体,FAM83A共有3个不同的剪接体。经对FAM83A的多物种氨基酸序列相似性比较,人与长臂猿、小鼠、火鸡和爪蟾的相似性分别为98%、87%、64%和41%,可见氨基酸组成在脊椎动物中保守性较高。各物种序列大小接近,起始氨基酸都是蛋氨酸。基于FAM83A多序列比对进化树分析,人和长臂猿在进化上最为接近,在其他物种也有比较接近的进化来源。

2.3 理化性质与亚细胞定位 FAM83A(AF497803)由367个氨基酸组成,生物软件预测相对分子质量为40 606,等电点为8.97。该蛋白质的半衰期在人体网织红细胞为30h;不稳定指数为51.49(>40考虑为不稳定),分类为不稳定蛋白质;脂肪指数为77.06,平均疏水值为-0.346,是亲水蛋白质。根据软件分析,预测该蛋白质在线粒体中表达的可能性稍大(43.5%),其次分别是细胞核(34.8%)和细胞质(21.7%)。

2.4 蛋白质结构 ELM预测发现有PK、PKA等磷酸化位点,MAPK作用识别位点,SH2、SH3,RPEL和 WH2结合基序等,未发现有保守结构域存在。未预测出信号肽剪切位点。SOPMA方法预测二级结构,发现FAM83A中α螺旋占43.5%,β折叠占5.72%,延伸链和无规则卷曲结构分别占11.99%和48.5%。

2.5 FAM83A基因表达 电子表达谱分析显示,FAM83A基因在部分正常组织和多种肿瘤中均有表达,见表1。

表1 FAM83A基因电子表达谱

2.6 FAM83A在乳腺癌细胞系和乳腺癌组织中的表达 RTPCR结果显示,FAM83A在乳腺癌细胞系 MDA-MB-231和MCF-7中均有表达(图1A)。在5例乳腺癌组织中,3例FAM83A高表达;而在相应的癌旁组织和乳腺纤维瘤中均不表达,见图1B~C。

图1 半定量RT-PCR检测FAM83A基因的表达

3 讨 论

乳腺是最常发生良、恶性肿瘤的器官,癌性增生与良性肿瘤有着本质的不同,治疗方案也完全不同[6]。所以,在筛选乳腺癌高表达基因时,临床工作者希望寻找在癌组织中高表达,而在良性肿瘤组织中不表达或低表达的基因,对指导临床的诊断和治疗更具有意义。CGAP SAGE数据库能够全面分析肿瘤组织基因表达谱、寻找肿瘤特异性表达新基因[7]。在SAGE文库中,本研究选择了乳腺癌和良性乳腺肿瘤两个池,提交后看到良性乳腺肿瘤池的文库在短序列标签中有7个,长序列标签中有5个,主要是:乳腺纤维瘤、乳腺肌上皮瘤和良性乳腺间质瘤,并最终筛选出乳腺癌高表达基因FAM83A。而且,半定量RT-PCR结果也进一步证实了生物信息学数据库的可靠性。该基因在乳腺癌细胞系和多例乳腺癌组织中均高表达。

目前,FAM83A的研究很少,只是将该基因作为肿瘤生物学标记物用于外周血的检测[8-9],但关于该基因的功能少见文献报道。ELM 分析提示,该蛋白质具有 LIG_14-3-3_1,LIG_14-3-3_3蛋白质配体,cylin底物识别位点和PK、PKA磷酸化位点等。14-3-3蛋白质是真核生物中的一类保守蛋白质家族,它们在细胞中发挥着信号转导,细胞周期调控,凋亡和应激反应以及肿瘤恶性转化等重要的作用,是蛋白质间相互作用的媒介和调节者[10]。Cyclin底物识别位点在cyclin/CDK相互作用蛋白质中被广泛发现。该基序在CDK中的存在增加了(ST)Px(KR)基序的磷酸化水平。它通过cyclin蛋白质中的保守区域被识别,并与p21Kip cyclin相似的方法结合[11]。PK和PKA磷酸化位点是信号传导调控中的常见分子结构,在细胞增殖及细胞周期中有着广泛的调节作用[12]。

以上分析发现,该蛋白质在进化上保守,从低等到高等动物都有相似蛋白质的表达,是不稳定的亲水性蛋白质,可能定位于线粒体上,有着多个功能位点和基序,提示参与信号转导和细胞周期调控。特别要提出的是,该基因存在多个转录变异体,表明它在生物体发育过程中的细胞增殖和凋亡的调控方面起着重要的作用。该基因在乳腺癌中的高表达具有显著意义,很可能是通过使细胞持续增生,控制凋亡和改变细胞周期而发挥作用的。

[1] Yang L,Parkin DM,Ferlay J,et al.Estimates of cancer incidence in China for 2000and projections for 2005[J].Cancer Epidemiol Biomarkers Prev,2005,14(1):243-250.

[2] 任丽,陈瑛.乳腺癌骨转移的实验室检测进展[J].国际检验医学杂志,2010,31(2):137-138,141.

[3] Liska V,Holubec L Jr,Treska V,et al.Evaluation of tumour markers as differential diagnostic tool in patients with suspicion of liver metastases from breast cancer[J].Anticancer Res,2011,31(4):1447-1451.

[4] 刘娜,郭云波,孙显赫,等.比较基因组学平台的设计与实现[J].南方医科大学学报,2010,30(2):219-223.

[5] Puntervoll P,Linding R,Gemund C,et al.ELM server A new resource for investigating short functional sites in modular eukaryotic protein[J].Nucleic Acids Res,2003,31(13):3625-3630.

[6] 陈国平,夏立平,翁阳,等.乳腺癌90例临床与病理分析[J].海南医学院学报,2009,15(2):151-153.

[7] Kavak E,UnlüM,Nistér M,et al.Meta-analysis of cancer gene expression signatures reveals new cancer genes,SAGE tags and tumor associated regions of co-regulation[J].Nucleic Acids Res,2010,38(20):7008-7021.

[8] Li Y,Dong X,Yin Y,et al.BJ-TSA-9,a novel human tumor-specific gene,has potential as a biomarker of lung cancer[J].Neoplasia,2005,7(12):1073-1080.

[9] Liu L,Liao GQ,He P,et al.Detection of circulating cancer cells in lung cancer patients with a panel of marker genes[J].Biochem Biophys Res Commun,2008,372(4):756-760.

[10]Tzivion G,Avruch J.14-3-3proteins active cofactors in cellular regulation by serine/threonine phosphorylation[J].Biol Chem,2002,277(5):3061-3064.

[11]Lowe ED,Tews I,Cheng KY,et al.Specificity determinants of recruitment peptides bound to phospho-CDK2/Cyclin A[J].Biochemistry,2003,41(52):15625-15634.

[12]Dash PK,Moore AN,Kobori N,et al.Molecular activity underlying working memory[J].Learn Mem,2007,14(8):554-563.

猜你喜欢

文库标签乳腺
乳腺结节状病变的MRI诊断
专家文库
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
体检查出乳腺增生或结节,该怎么办
无惧标签 Alfa Romeo Giulia 200HP
专家文库
不害怕撕掉标签的人,都活出了真正的漂亮
得了乳腺增生,要怎么办?
标签化伤害了谁