首页

水稻SBP 基因家族生物信息学分析

水稻SBP 基因家族生物信息学分析

摘要:SBP (squamosa promoter binding protein, SBP)基因家族是植物所特有的一类重要转录因子,

广泛参与植物生长、发育以及多种生理生化反应的信号传导。水稻是目前为止基因组测序相当完整的一类植物,而且水稻也是现在人类生存赖以依存的粮食,因此水稻早已成为分子生物学研究的重点对象,进行水稻基因组信息挖掘与分析对于水稻功能基因组学的发展具有重要意义。本实验以植物(水稻)特异转录因子SBP 基因家族为实例,讲述如何利用生物信息数据库资源和软件工具,对该基因家族进行分析。本章所用数据主要来自北京大学生物信息中心(http://www.cbi.pku.edu.cn/chinese/)构建的植物转录因子数据库,研究对象主要为水稻基因组中 29个SBP 转录因子基因。所用生物信息学工具包括基因结构显示、双序列比对、蛋白质功能域识别、蛋白质保守域预测、序列图标构建、多序列比对、系统发育树构建、,以及蛋白质二级、三维结构空间图形显示等。本实验结果均为水稻SBP 基因家族的进一步功能分析提供了重要研究基础。

关键词:水稻、SBP 家族、生物信息学

引言:我们知道,转录前调控、转录调控和转录后调控是真核生物基因表达调控的重要组成部分,其

中转录调控通过顺式作用元件和反式作用因子相互作用实现。顺式作用元件(cis-element )泛指 DNA序列一个片段,通常位于被调控基因的上游,主要包括启动子(promoter )、增强子(enhancer )和抑制子(suppressor )三类。反式作用因子泛指与顺式作用元件直接或间接结合 并参与靶基因转录过程的调控因子,通称转录因子(transcription factor )。转录因子可以分为两大类,即通用转录因子(general transcription factor)和特异转录因子(specific transcription factor )。通用转录因子与靶基因上游约 10-35 位的 TATA 框(TATA-box )或启动子区域转录起始位点(transcription start site )DNA 序列结合,并与 II型 RNA聚合酶一起,形成转录起始复合物。特异转录因子种类繁多、功能复杂,它们与靶基因上游各种特定 DNA序列片段结合,激活或抑制靶基因转录活性,以调控靶基因在不同组织、不同细胞、不同环境条件下特异表达。如无特别说明,通常所说的转录因子即指特异转录因子。 一、 结果与分析 1. 水稻SBP 的挖掘

先到Pfam 数据库中去搜索SBP 结构域(domain), 其标识号应该是xxx (PF03110), 获取它的HMM 序列文件。从 TIGR 水稻数据库(http://rice.plantbiology.msu.edu, The TIGR Rice Database release 6.0)下载水稻基因组12条染色体的蛋白质序列。然后利用基于隐马尔科夫模型的 HMMER 程序(版本3.0) 来搜索, E

将从 TAIR 获得的水稻SPB 家族基因的 CDS 序列和对应的全基因组序列, 利用 Gene Structure Display Server(http://gsds.cbi.pku.edu.cn/)绘出基因结构图

表1 20条基因结构图

3. 蛋白质分析

1)利用序列保守结构域识别系统网站(Multiple EM for Motif Elicitation, MEME, http://meme.sdsc.edu/),对上述拟南芥 SBP 转录因子保守结构域进行识别。首先,将 29 个 SBP转录因子同时提交,结果表明,它们都具有长度为 79 个残基的 SBP 结构域,共有3个

motify

表2 29个SBP 转录因子的3个motify 的标识序列

表3 3个motify 在SBP 蛋白质序列的位置

2)二级结构分析

二级结构是指不同氨基酸间C=O 和N-H 基团间的氢键形成的稳定结构,主要为α- 螺旋和β- 折叠。利用SOPMA 程序(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa.sopma.html)对水稻29 条SBP 家族蛋白质序列二级结构进行预测,结果发现有21条蛋白质序列的二级结构不同,所有的氨基酸序列都以随机卷曲为主要组成部分,其次就是α-螺旋。

LOC_Os01g18850 LOC_Os01g69830 LOC_Os02g08070.1 LOC_Os02g04680.2 LOC_Os02g04680.1 LOC_Os02g07780.2 LOC_Os02g07780.1 LOC_Os03g61760 LOC_Os04g46580 LOC_Os04g56170 LOC_Os05g33810 LOC_Os06g44860 LOC_Os06g49010 LOC_Os06g45310 LOC_Os07g32170 LOC_Os08g39890 LOC_Os08g41940 LOC_Os08g40260 LOC_Os09g32944 LOC_Os09g31438 LOC_Os11g30370

α-螺旋 37.24% 20.15% 31.44% 18.38% 16.20% 21.37% 20.72% 37.05% 26.11% 34.38% 32.78% 31.92% 16.42% 31.78% 32.87% 17.99% 23.52% 34.12% 22.88% 14.25% 31.82%

延伸链 13.57% 19.17% 15.72% 12.82% 14.93% 15.38% 17.13% 12.69% 10.28% 14.18% 16.15% 15.02% 17.47% 11.08% 8.33% 8.87% 16.92% 12.19% 15.47% 11.75% 9.09%

β-折叠 3.83% 8.25% 9.17% 2.14% 3.62% 6.84% 7.97% 5.26% 4.72% 8.11% 6.53% 7.98% 4.63% 6.71% 8.33% 7.91% 6.59% 4.82% 4.45% 4.75% 5.11%

无规卷曲 45.36% 52.43% 43.67% 66.67% 65.25% 56.41% 54.18% 44.99% 58.89% 43.03% 44.54% 45.07% 61.47% 50.44% 50.46% 65.23% 52.97% 48.86% 57.20% 69.25% 53.98%

表3 21条氨基酸序列的二级结构的组成 3) 三级结构分析

蛋白质空间结构模型通过Swiss-Model (http://swiss model.expasy.org) 建立。通过Swiss-Model 对葡萄的45 条氨基酸序列进行三维结构同源建模,结果表明它们绝大多数具有十分相似的三维结构。例如:

LOC_Os01g18850.1 LOC_Os06g45310.1 LOC_Os11g30370.1 4. 进化树构建

利用MAGE 对21条SBP 结构域序列做分子进化分析

讨论

以SBP 蛋白保守区氨基酸序列为信息探针,从水稻数据库中检索到SBP 转录因子相应的蛋白序列,成功地利用生物信息学数据库和软件工具,对水稻SBP 转录因子家族基因结构和蛋白质结构等进行了分析,从中得到该转录因子家族不同成员之间的相互关系和演化历程,至于其生物学功能,还需要在葡萄中进行克隆以及表达分析来验证。目前,从高等植物中已分离鉴定的转录因子有数千种,已经证明其中相当一部分在调节植物的生长发育及其对外界环境的反应等方面起着重要的作用。不仅如此,还发现一个逆境相关转录因子可以调控多个逆境相关功能基因的表达,在利用转录因子来改良植物抗逆性方面效果显著。因此,植物转录因子一直是现在生物学研究领域的热点。从TAIR 获得水稻SBP 转录因子相应的蛋白序列,成功地利用生物信息学数据库和软件工具,对水稻SBP 转录因子家族基因结构和蛋白质结构等进行了分析,从中得到该转录因子家族不同成员之间的相互关系和演化历程,至于其生物学功能,还需要在水稻中进行克隆以及表达分析来验证,因此,该研究就为下一步研究水稻转录因子的生物学功能提供了参考依据。 参考文献:

[1]曹雪,上官凌飞,于华平,杨光,王晨,谭洪花,房经贵,葡萄SBP 基因家族生物信息学分析,南京农业大学园艺学

院, 南京, 210095,基因组学与应用生物学, 2010年,第29卷,第4期,第791-798页 [2] 罗静初,拟南芥SBP 转录因子基因家族分析,北京大学