头部banner

一、拟南芥转录因子文库筛选理论基础

微如草芥,却贡献巨大的模式植物——拟南芥拥有有5对染色体,1.25亿个碱基对,编码着2.5万个基因,据拟南芥转录因子数据库(DATF)统计,可查询2290个转录因子。

我们通过构建酵母文库单杂筛选或者DNA pulldown来筛选转录因子时,会发现捕获的转录因子数量特别少,甚至没有转录因子,这2000多个转录因子到哪里去了?

转录因子是一类周期性调控蛋白,只有在特定的生长时期,特定的组织部位才会有一定丰度的表达。其功能如同手枪的“扳机”,电路的“开关”。微量表达就能调控下游靶基因,改变生物性状。功能如此强大的转录因子,如神龙见首不见尾的大侠,只有在“需要”的时候,偶露峥嵘。

构建酵母单杂文库时,即使选择建库材料时遵循了跨时空的原则,能够囊括的转录因子基因依然很少,筛不到靶标转录因子实属正常。

北京大学邓兴旺院士团队针对这种状况,将拟南芥中出现频率较高的1500多种转录因子调取出来,组成转录因子文库,避开了时空效应,这是最“土”的手段,却是科研路上最“聪明”的策略。

转录因子文库的实验设计和实验方法见刊于《Molecular Plant》题为“A high-throughput screening system for Arabidopsis Transcription factors and its application to Med25-dependent tranional regulation.”

转录因子文库文献

二、转录因子文库的筛选原理


转录因子文库即可应用于酵母单杂交筛选调控启动子的转录因子,也可应用普通的核蛋白双杂交筛选与之互作的转录因子。钟鼎更推荐将转录因子文库应用于单杂交筛选,简单介绍下酵母单杂交筛选的工作原理。

技术流程图

转录因子的全长序列包含完整的ORF,通过Gateway技术重组在pDest22载体上,转录因子蛋白与GAL4-AD结构域融合表达,该部分组成了猎物蛋白区域,转化Y187酵母菌株,形成待筛选的猎物质粒的酵母细胞。将启动子DNA序列克隆至pHISi-1载体的MCS区域,与载体自带的PminHIS启动子构成一个新的启动子区域。线性化的诱饵质粒pHISi-1-promoter转化YM4271,将诱饵DNA结合结构域整合至酵母基因组,形成了包含诱饵启动子DNA的酵母细胞。

上述两种细胞进行mating,杂交后的酵母细胞可以在非筛选培养基SD/-Trp/-His上生长,上述的pHISi-1-promoter启动子活性有限,当增加筛选压力后,如果没有转录因子结合上去,杂交菌株是无法在筛选培养基上生长。依据这个原理,参考诱饵菌株自激活的3AT浓度,设置合理的梯度,例如筛选培养基(SD/-Trp/-His/15 mM 3-AT和SD/-Trp/-His/30 mM 3-AT),即可筛选出与启动子DNA序列结合的转录因子蛋白。

双杂原理与单杂类似,诱饵质粒pDEST32-bait转化AH109,与Y187菌株mating,通过四缺培养基SD/-Leu/-Trp/-His/-Ade筛选阳性克隆。

转录因子库含有1500+转录因子,筛库工作量巨大,相当于需要单独进行1500+次的点对点验证。



三、载体信息

载体图谱


四、拟南芥转录因子家族列表

一种DNA结合基序,是一类在早期发育过程中对调控基因表达起着至关重要作用的转录因子。
结合DNA特征:这一类与DNA识别序列:GCCNNNGGC结合,并可激活靶基因转录。
蛋白功能注释:在哺乳动物中已鉴定出AP-2的四种不同亚型:AP-2α、β、γ和δ。每个家族成员都有一个共同的结构,在N端区域富含脯氨酸/谷氨酰胺的结构域(proline/glutamine-rich domain),负责转录激活;在C端区域含有helix-span-helix domain,介导二聚和位点特异性DNA结合。
AP2 (30)
生长素响应因子(ARF)是一类调控生长素响应基因表达的转录因子,在生长素的信号传导过程中处于中心位置,它可与生长素响应元件特异结合,促进或抑制基因的表达.ARF与这些基因启动子中的TGTCTC生长素反应元件(AuxRE)特异性结合ARF (37) 拟南芥基因组编码22种应答调节因子(ARR),其中12种含有一种称为ARRM(B型)的Myb样DNA结合域。其余的(A型)除了在不变位置含有两个天冬氨酸和一个赖氨酸残基(DDK)的信号受体结构域外,不具有任何明显的功能单元,它们的基因由细胞分裂素转录诱导而无需从头合成。B型成员ARR1和ARR2以序列特异性方式结合DNA,并作为转录激活子。ARR-B (21) B3超家族的所有成员都包含一个约110个氨基酸的区域,称为B3结构域。该结构域最初命名是因为它是玉米基因VIVIPAROUS1(VP1)的第三个基本结构域。第一和第二基本结构域(B1和B2)特异于VP1样蛋白,但包含B3结构域的基因在植物基因组中广泛存在。VP1的B3结构域编码序列特异性DNA结合活性。B3 (77) BBR/BPC蛋白通过同源异型转录因子基因的转录调控控制花发育、干细胞生态位大小和种子发育。
与发育过程中基因调控序列中存在的富含GA的元件(GAGA重复)特异性结合。正调节同源基因BKN3。
BBR-BPC (17)
BES1是拟南芥油菜素类固醇(Brassinosteroids,简称BR)信号通路下游的转录因子,该转录因子家族包括BES1、BZR1、BEH1、BEH2、BEH3、BEH4六个同源性很高的成员。到目前为止,已经有很多研究者证明,此家族成员中的BZR1、BES1参与BR信号的响应、细胞的伸长与分裂、叶与根的生长发育、维管组织的发育、植物的开花、雄蕊的育性、抗逆性、衰老等多个方面的调控。与此同时,研究者也证明了BES1和BZR1与其他转录因子比如BIM1、PIF4一起结合到共同靶基因的启动子区域来共同调节靶基因的表达。BES1 (14) 许多编码C2H2锌指结构域的基因已经从包括植物在内的多种真核生物中鉴定出来。典型的ZF(锌指)序列(CX2-4CX3FX5LX2HX3-5H)包含两个半胱氨酸和两个组氨酸,它们与锌原子协调,形成紧密的核酸结合结构域。迄今为止,这些蛋白质中的大多数是DNA结合转录因子,其中许多在植物、动物和真菌的发育中起着关键作用。C2H2 (116) ccch锌指蛋白含有三个串联的半胱氨酸(cys)和一个组氨酸(his)组成的保守结构域,拟南芥ccch蛋白依据ccch结构域数目和类型,分为11个亚家族,目前已有超过20种蛋白的功能被解析出来,这些蛋白参与了植物生长发育和逆境胁迫等诸多过程。例如,在应对逆境方面,atc3h49/attzf3通过aba信号参与抵抗盐胁迫。atc3h66/attzf9能够被mpk3和mpk6磷酸化,参与pti免疫反应。拟南芥atc3h14和atc3h15高度同源,包含cx8cx5cx3h结构域,是典型的ccch锌指蛋白。它们具有转录激活活性,能够结合dna和rna,是atmyb46的直接靶标,冗余调控茎秆细胞壁增厚、花粉发育和细胞伸长。而且,atc3h14在杨树中的同源基因pdc3h17和pdc3h18参与木材细胞分化和细胞壁增厚。C3H (66) 钙调素结合转录因子的CAMTA家族在拟南芥中包括六个成员。每个蛋白质包括用于钙调素结合的IQ结构域;蛋白相互作用的锚蛋白重复;具有非特异性DNA结合活性的TIG结构域;以及具有特异性DNA结合活性的CG-1结构域。CG-1域识别核心一致序列vCGCGb,称为CG-2元件。该序列与CM2序列CCGCGT匹配,并与ICEr1元件重叠。因此,提出了一种可能性,即一种或多种CAMTA蛋白可能在调节CBF2表达中起作用。CAMTA (10) CO(CONSTANS)基因在昼夜节律时钟和控制分生组织特性的基因之间起作用。在拟南芥中,由两个保守结构域定义的共转录因子。第一个是靠近氨基末端的锌指区域,类似于B盒,它调节几种动物转录因子中的蛋白质-蛋白质相互作用。第二个是靠近羧基末端的43个氨基酸的区域,称为CCT(CO,CO-like,TOC1)结构域。CO-like (22)
CPP-like(cystein-rich polycomb-like protein)蛋白是小转录因子家族的成员,其典型特征是存在一个或两个类似的富含Cys的结构域,称为CXC结构域。该家族成员广泛存在于植物和动物中,但在酵母中不存在,CPP-like蛋白的CXC结构域在从变形虫到植物到哺乳动物的物种中表现出高度保守性。CPP样基因在植物生殖组织的发育和细胞分裂的控制中起着重要作用。CPP (9) DBB基因在开花调控、根系生长、光形态建成、种子萌发、果实发育、逆境胁迫等生物学过程中发挥重要作用,大多数成员N端都含有保守结构域B-box1和B-box2,精氨酸和亮氨酸是在所有成员中都保守的氨基酸残基。DBB (14) Dof(DNA binding with one finger)家族,一类特殊的锌指结构域TFs,其特征是具有C2-C2手指结构的50个氨基酸的保守区,与一个碱性区相关,该碱性区特异性结合具有5’-T/AAAAG-3’核心的DNA序列。据报道,Dof蛋白参与了胚乳发育过程中的种子贮藏蛋白合成、碳水化合物代谢相关基因的光调节、植物防御机制、种子萌发、萌发后糊粉中的赤霉素反应、生长素反应和气孔保卫细胞特异性基因调节等过程中的基因表达调控。Dof (47) E2F转录因子是一个共享相关的DNA结合域并与重叠的靶启动子组结合的家族。大多数E2F蛋白与DP蛋白结合并形成以序列特异性方式与DNA结合的异二聚体复合物。E2F蛋白控制细胞周期中多个过程所需的基因的时间表达。因此,E2F依赖性转录水平对细胞增殖很重要。E2F/DP (16) EIN3-like(EIL)蛋白是乙烯信号转导途径中重要的核转录因子,其属于一个小的转录因子家族.这类转录因子在氨基酸序列N端高度保守,包括酸性氨基酸区、脯氨酸富集区、碱性氨基酸簇等涉及DNA结合的重要结构域,它们通过直接结合到初级乙烯反应元件(PERE)上来调节相关基因的表达。EIL (6)
AP2/ERF转录因子家族成员至少含有一段60个左右氨基酸构成的AP2保守结构域,根据结构域的数量和识别序列的不同可以将其分为AP2、ERF、DREB、RAV和Soloist 5个亚家族,且在拟南芥、水稻、玉米和番茄等植物中,AP2/ERF转录因子及其各个亚家族成员的数量各不相同。ERF (139) 拟南芥FHY3和FAR1编码两种与突变体样转座酶相关的蛋白,它们共同作用,通过直接激活FHY1和FHL的转录来调节phyA信号,其产物对于光诱导的phyA核积累和随后的光反应至关重要。FHY3和FAR1具有可分离的DNA结合和转录激活结构域,在突变子样转座酶中高度保守。此外,FHY3和FAR1的表达受到phyA信号的负调控。FAR1 (26) Golden2-Like转录因子,又名G2-Like和GLK,是一类在植物中广泛存在的转录因子,属于Myb类转录因子中的GARP转录因子超家族中的一类重要转录因子。G2-Like转录因子目前在苔藓、拟南芥、水稻、玉米、辣椒和番茄中均有发现,主要功能表现在叶绿体发育、果实品质、生物胁迫和非生物胁迫、植物衰老和激素影响等几方面,并且最近有研究表明GLK转录因子在植物根部也有表达G2-like (64) GATA家族是一类能识别GATA基序(moctif)并与之结合的转录调节因子,其普遍具有锌指结构.GATA家族的共同特点是对一致性序列(T/A)GATA(A/G)具有高度亲合性.其家族成员已发现在动物,真菌,植物等生物中广泛存在.GATA (41) GRAS蛋白在C端显示出保守的残基,但含有可变的N端,具有某些氨基酸的均聚体延伸。最近已经表明,调节根生长的两种GRAS蛋白,SCARECROW(SCR)和SHORTROOT(SHR)相互作用,而参与调节植物生长的一类GRAS蛋白DELLA蛋白与参与光敏色素信号传导的转录因子相互作用。GRAS (37)
生长调控因子(growth-regulating-factor,GRF)基因是植物中一类高度保守的转录因子家族。多数GRF为miR396的靶基因,受其负调控。GRF常和另外一类蛋白质因子GIF(GRF-interacting-factor)相互作用来共调节靶基因的表达,从而调控植物的生长发育。GRF (9) 植物特异性GeBP转录因子家族由21个成员组成,所有成员的功能未知。由四个成员组成的子集,即创始成员GeBP和GeBP-like蛋白(GPL)1、2和3,共享一个保守的C末端结构域。GeBP (23) PHD即Cys4-His-Cys3锌指,存在于植物或动物的许多调节蛋白中,经常与染色质介导的转录调节相关。在植物同源结构域转录因子中,PHD指与上游亮氨酸拉链结合。两个结构域一起形成一个高度保守的180氨基酸区域,称为ZIP/PHDf基序,当PHD指嵌入该基序时,其转录活性被掩盖。HB-PHD (3) HB-other (11) HD-Zip家族的成员在HD的下游有一个亮氨酸拉链基序(LZ)。这两个基序存在于属于其他真核生物界的物种中发现的转录因子中,但它们在单一蛋白质中的关联是植物特有的。HD负责与DNA的特异性结合,而LZ作为二聚基序。HD-Zip蛋白以二聚体的形式与DNA结合,而LZ的缺失完全消除了它们的结合能力,这表明由该基序驱动的单体的相对取向对于DNA的有效识别至关重要。HD-ZIP (58)
HRT基因包含两个内含子,其中较大的(5722个碱基对(bp))包含一个3094 bp的线状元,与玉米克隆1同源。体外诱变和锌和DNA结合分析表明,HRT包含三个不寻常的锌指,具有CX8-9CX10CX2H共有序列。HRT靶向于细胞核,同源物在其他植物中表达。在体内,植物细胞中的功能测试表明,全长HRT可以抑制某些启动子的表达,包括Amy1/6-4和Amy2/32α-淀粉酶启动子。相反,截短形式的含有DNA结合域的HRT可以激活或抑制这些启动子的转录。HRT-like (2) 热应激转录因子(HSF)是植物热应激反应的主要调节因子。拟南芥基因组的测序显示存在21个开放阅读框(ORF),编码分配给A-C类的推定HSF。HSF (25) LBD蛋白家族代表了一类识别顺式元件GCGGCG的新的DNA结合转录因子。DNA结合活性存在于LOB结构域中,该结构域在43个拟南芥家族成员以及其他植物物种中的LBD蛋白中都是保守的。LBD (50) 植物特异性叶蛋白(LFY)对于双子叶植物物种从营养发育到生殖发育的重要转换是必要的和充分的。LFY控制着花的产生,这些花是从茎顶端分生组织的侧翼形成的,而不是次级花序。由于LFY是区分花和花序分支的所有主要特征所必需的,因此它被称为分生组织识别基因。
在启动分生组织身份转换后,LFY在激活花同源基因中起第二个作用,该基因指定花器官的身份。LFY的两种作用在基因和分子上是可分离的。LFY通过转录调控发挥其发育效应;LFY已被证明是体内的转录因子。
LFY (1)
拟南芥lsd1突变体对细胞死亡起始物有高度反应,不能限制细胞死亡的程度。超氧化物是细胞死亡繁殖的必要和充分信号。因此,LSD1监测超氧化物依赖性信号并负调控植物细胞死亡途径。LSD1蛋白包含三个锌指结构域,由CxxCxRxxLMyxGasxVxCxC定义。这些结构域存在于另外三个拟南芥基因中,表明LSD1定义了锌指蛋白亚类。LSD1组成性表达,与突变表型一致。交替剪接导致编码额外五个氨基酸末端氨基酸的低丰度mRNA。LSD (12)
MADS-box是一个由58个氨基酸组成的DNA结合域,在称为CArG盒[CC(a/T)6GG]的共有识别序列上与DNA结合。由于分解的晶体结构,已详细研究了人和酵母MADS-box蛋白与DNA的相互作用。I结构域的保守性较低,有助于二聚化的规范化。K结构域的特征是螺旋结构,这有助于MADS盒蛋白的二聚化;在某些情况下,已显示其含有反式激活结构域或有助于形成多聚MADS盒蛋白复合物M-type_MADS (70) MADS-box是一类植物中规模最大的转录因子家族,在植物生长发育调控和信号传导中发挥着重要作用,可分为I型和II型两个亚家族。II型亚家族除含有MADS结构域外,还可能含有I、K和C结构域,因此又被称为MIKC类型。MIKC_MADS (76) 编码的蛋白质对于控制多种细胞类型的增殖和分化至关重要,并共享保守的MYB DNA结合域。该结构域通常包含多达三个不完全重复,每个重复形成约53个氨基酸的螺旋-转-螺旋结构。三个规则间隔的色氨酸残基在三维螺旋-旋转-螺旋结构中形成色氨酸簇,是MYB重复的特征。c-Myb中的三个重复称为R1、R2和R3;来自其他MYB蛋白的重复根据它们与R1、R2或R3的相似性进行分类。MYB (168) 从拟南芥cDNA文库中分离出一个新的myb样基因(AtmybL2)。单拷贝基因定位在染色体I上。基因特异性转录物优先在叶片中发现。预测的基因产物由已知参与DNA结合的保守的N-末端myb结构域和独特的富含脯氨酸的C-末端部分组成。值得注意的是,myb结构域仅包括在其他myb样蛋白中发现的典型的两个或三个色氨酸重复中的一个。MYB_related (97) NAC转录因子N端拥有一个介导DNA结合的折叠结构域,C端具有高度多样性,其命名来自于矮牵牛(Petunia hybrida)和拟南芥(Petunia hybrida)CUC1、CUC2,其突变型胚胎不完整。目前,互花米草、石榴、柳树等的NAC基因家族已经得到分析鉴定。研究表明,NAC转录因子不仅普遍参与了植物生长发育过程的调控,包括种子萌发、细胞分裂、细胞次生壁合成、器官边界的建成、分生组织的形成、侧根发育、植物开花和衰老,参与了胁迫应答、激素调控以及诱导寄主对病原菌侵染产生抗性等过程,对于植物生长具有重要作用。NAC结构域不具有经典的螺旋-转角-螺旋模体,而是由一个扭曲的β-折叠组成,周围还有一些螺旋状的元素.NAC (138)
人类NF-X1蛋白和真核生物中的同源蛋白代表一类转录因子,其特征在于NF-X1型锌指基序。拟南芥基因组编码两种NF-X1同源物,我们称之为AtNFXL1和AtNFXL2。NF-X1 (2) NF-YA蛋白质的特征是存在富含Gln(Q)和Ser/Thr(S/T)的NH2末端、亚单位相互作用域(NF-YB/NF-YC相互作用)和DNA结合域。蛋白质相互作用和DNA结合结构域在植物和其他真核生物谱系之间非常保守。NF-YA (21) 与NF-YA一样,NF-YB和NF-YC家族具有描述良好的亚单位相互作用和DNA结合域。NF-YB和NF-YC的保守区与组蛋白折叠基序具有结构和氨基酸同源性。具体而言,NF-YB与H2B组蛋白的组蛋白折叠基序相关,而NF-YC亚单位与H2A组蛋白相关。NF-YB (27) 与NF-YA一样,NF-YB和NF-YC家族具有描述良好的亚单位相互作用和DNA结合域。NF-YB和NF-YC的保守区与组蛋白折叠基序具有结构和氨基酸同源性。具体而言,NF-YB与H2B组蛋白的组蛋白折叠基序相关,而NF-YC亚单位与H2A组蛋白相关。NF-YC (21) SPL/NZZ的蛋白的C-末端带有一个典型的转录抑制基序EAR基序,具有转录抑制活性NZZ/SPL (1)
NLP(NIN-Like Protein)家族是植物特有的一类转录因子,它能够结合靶基因启动子中的特殊“元件”(硝酸盐响应元件,Nitrate Response Element,NRE)来激活下游基因的表达,参与调节植物氮代谢过程Nin-like (17) RAV基因家族属于AP2/ERF家族的一个亚族,一般包含一个AP2/ERF结构域和一个B3 DNA结构域,它们分别位于N末端和C末端(Yang等2016)。AP2结构域是一段60~70个保守的氨基酸残基组成的区域,可以和GCC-box (AGCCGCC)结合。B3结构域可以识别6 bp的DNA序列CACCTG并结合,该结构域还存在于ARFs和VP1/ABI3家族中,主要参与植物对外源脱落酸(ABA)和生长素的调控反应。RAV (7) 这个0.7kb的cDNA编码一个只有70个氨基酸的不寻常的小肽,其基本结构域包含核定位信号和假定的DNA结合螺旋。这种蛋白质被命名为S1Fa,在双子叶植物和单子叶植物之间高度保守,可能代表一类新的DNA结合蛋白。相应的mRNA在根和黄化的幼苗中比在绿叶中积累更多。这种表达模式与S1F结合位点的组织特异性功能相关,该位点优先抑制根和黄化植物中的rps1启动子。S1Fa-like (4) SAP转录因子是一类广泛存在于植物细胞中的多功能基因。研究表明,SAP不仅可以参与合成SCF,通过调控PPD(PEAPOD)的稳定性来控制分生组织细胞的增殖和器官的大小,还通过调控转录抑制复合体(PPD-KIX-TPL)的稳定性来控制类分生组织的增殖和器官的代销。SAP (1) SBP因为编码DNA结合结构域的保守核苷酸序列,又称为SBP 盒(SBP-box) 基因,SBP盒编码的蛋白质序列称SBP结构域(SBP-domain),含79个氨基酸残基。均含2个锌指结构(Zinc finger)。其中一个(SPL3) N-端锌指结构序列模体为Cys3His, C ~端锌指结构为Cys2HisCys;另一个(SPL7) N~端锌指结构序列模体为Cys4,C -端锌指结构与SPL3相同,也是Cys2HisCys。其与SBP结构域结合的顺式元件具有以GTAC为核心的迥文结构。SBP 结构域C端富含碱性氨基酸,可能为双向核定位信号(nuclear localizatio signal, NLS) .SBP (30)
短链相关序列(SHI-related sequence, SRS)基因 , 也 称 为 短 节 间 (short internodes, SHI) 或 者 STY(STYLISH)基因,编码一类植物特有的转录因子, 在调节植物生长发育中发挥重要作用。SRS 基因家族具有 2 个高度保守结构域,分别为环状锌指结构域和 IGGH 结构域。 侧根原基 1(lateral root primordium1, LRP1)是拟南芥中发现第一个SRS基因,通过调节生长素的合成对侧跟发育起负调控作用。SRS (16) 信号转导子和转录激活子(stats) 是一一个转录因子家族,它们的作用就是可以将细胞表面的信号传输到细胞核。目前为止已经确定有七个stat家族成员,它们具有以下的共同特征:
(1)具有一个氨基末端,参与控制蛋白质-蛋白质之间的相互作用,可以促使两个相联会的dna转录二聚体形成四聚体; (2)一个螺旋-螺旋控制区域参与调节与其它蛋白质之间的相互作用; (3)一个dna结合结构域; (4) 一个连接域; (5)一个同源结构域2 (sh2),促使stats结合激活的受体和形成二聚体; (6)在c末端具有一个转录结合域。所有的stats在sh2结合域和转录结合域包含一个保守的酪氨酸(y),并且除了stat2 以外,它们在转录结合域都会具有一个丝氨酸(s) 磷酸化位点。
STAT (4)
TALE转录因子家族包含KNOX亚家族和BELL亚家族,编码1个由63个氨基酸组成的非典型同源结构域,额外的3个氨基酸(P,Y,P)残基连接在第一螺旋区域和第二螺旋区域之间。TALE (33) TCP蛋白家族是一类植物特有的转录因子家族,它们参与了植物的多种生理生化过程,具有重要的调控作用。根据其代表成员TB1,CYC和PCFs的首位字母缩写,把含有这段保守氨基酸序列的基因命名为TCP,把这段保守氨基酸序列命名为TCP结构域 。TCP 结构域中的螺旋-环-螺旋区域(bHLH) 含有两个由保守的亲水氨基酸所构成的中性螺旋结构和一个在中间负责连接两个螺旋区域的环结构。TCP (33) Tribhelix 转录因子是一个植物特异性小家族,约60个亚族成员。植物中Trihelix 转录因子富含碱性氨基酸,酸性氨基酸、脯氨酸和谷氨酸,有3个a螺旋,呈helix-loop-helix-loop-helix构象,这些是其DNA结构域的共同特征。这些功能结构域的氨基酸序列在不同成员家族中高度一致和高度保守,通常以1或2形式存在于Trihelix蛋白的N末端或者C末端。Trihelix的保守结构域和MYB转录因子的Helix-turmn-helix有相近的结构。Trihelix (34)
V0Z( Vascular plant One Zine finger protein) 转录因子家族是高等植物所特有的转录因子,该家族最早于2004年由Mitsuda等人在拟南芥中被克隆,VOZ转录因子家族在拟南芥中有两个成员:AtV0Z1和AtV0Z2,在拟南芥中VOZ转录因子能够结合AVP1基因.上的一段花粉特异性的38bp的顺式作用元件,从而调控花粉发育过程。VOZ (3) WUSCHEL(WUS)相关的同源异型盒(WUSCHEL-related homeobox, WOX)转录因子家族是一类植物特有的转录因子家族。已报道的WOX转录因子家族成员具有调控植物干细胞分裂分化动态平衡、植物的胚胎发育和胚后发育等多种生物学功能"。在真核生物中广泛存在着同源异型盒(Homeobox, HB)转录因子超家族,其成员含有- -段60- 66个氨基酸组成的同源异型结构域(Homeodomain, HD) , WOX转录因子家族是HB转录因子超家族的一一个亚家族。WOX (18) WRKY 是植物特有的锌指型转录调控因子,因在其 N-端含有由 WRKYGQK 组成的高度保守的7个氨基酸序列而得名。
WRKY蛋白通常作为抑制因子和激活因子,并且该家族成员在重要植物过程的抑制和去抑制中发挥作用。WRKY基因表现出广泛的自我调节和交叉调节,有助于在具有内置冗余的动态网络中进行转录重编程。
WRKY (90)
Whirly (4) YABBY转录因子家族是锌指蛋白超家族(Zinc finger super-family)的亚家族,含有2个结构域:位于N端的锌指结构域(C2C2)和位于C端的HMG box相似的“螺旋-环-螺旋”结构域(又称YABBY结构域)YABBY (8)
ZF-HD(Zinc Finger Homeodomain )转录因子是植物特有的转录因子,它的显著特征是包含一个锌指结构域(zinc fingre,ZF )和一个同源异形盒结构域( homeodomain , HD),也是由此命名。所有同源异形基因都有一个由180个城基的核酸序列组成的同源异形框(homeobox),这个区域非常稳定,可以转录翻译折叠形成一个60个氨基酸组成的高度保守的三螺旋结构域.称为同源异形盒结构域,能够与特定的DNA序列相互作用。ZF-HD (18) Basic Helix-Loop-Helix (bHLH) 一种蛋白结构基序:碱性螺旋-环-螺旋的二级结构组合。
蛋白功能注释:bHLH在细胞发育或细胞活性中起重要作用。其中的BMAL1-Clock是分子生物钟中的核心转录复合物。
结合DNA特征:bHLH蛋白通常与一类 “CANNTG” 的序列结合。典型的DNA结合区称:“E-box”是CACGTG(回文)。然而存在一部分bHLH转录因子,尤其是bHLH-pas家族的转录因子,可与非回文序列结合,但其结构类似于E-box。 bHLH的转录因子可与其他bHLH的转录因子形成“均二聚”或“异二聚”,每种二聚体都具有特定的功能。
bHLH (225)
碱性亮氨酸拉链域(bZIP域),存在于许多DNA结合真核蛋白中。
立体结构特征:其包含一个介导序列特定的DNA结合特性的区域,以及连接(二聚)两个DNA结合区域所需的亮氨酸拉链。DNA结合区域通常为碱性氨基酸,如精氨酸和赖氨酸。然而包含这种特殊结构的蛋白质为转录因子。
蛋白功能注释:bZIP转录因子存在于所有真核生物中,是二聚体转录因子最大的家族之一。2008年的一项发展研究显示,所有植物最近的共同祖先的基因组编码了4个bZIP基因。
bZIP (127)

五、筛库案例展示(部分图片)

案例

六、方法学评价

  • 优势:
    1、拟南芥全长转录因子文库包含1500个全长cDNA,来自于62个TF家族、涵盖了已知转录因子的60%,远远超过普通酵母文库的TF因子数量。
    2、所有转录因子基因均为全长cDNA,包含完整的ORF,无需额外合成或调取基因,可直接使用。
    3、筛库过程为全长TF点对点验证,获得的结论即可为最终筛选实验结论,可以依据实验结论设计下游验证工作。
  • 劣势:
    1、为了提高mating效率,Y187文库菌液在进行mating前必须先点板活化,即使如此,也会有少量的克隆失败,出现假阴性数据。
    2、单杂交是通过3AT的浓度差异来设定筛选培养基,一旦诱饵基因有自激活现象,筛选浓度梯度设定不合理的情况下,产生假阳性/假阴性的概率较高。
    3、对于特殊处理或非拟南芥模式材料的其他材料,拟南芥TF库的适用性还是欠缺的。

热门栏目您可能对以下内容感兴趣:

基因功能研究整体解决方案 酵母单杂交技术 酵母双杂交技术