您的位置:首页 >> 新闻动态 >> 行业新闻

蓝藻水华暴发的内因——基因组和宏转录组视角

发布日期:2020-09-19 14:29:31 浏览次数:1763

原文标题:The Trait Repertoire Enabling Cyanobacteria to Bloom Assessed through Comparative Genomic Complexity and Metatranscriptomics

发表期刊:mBio

分区/影响因子:生物学1区,微生物学1区,TOP,6.784

发表时间:2020年

第一作者:Huansheng Cao

通讯作者:Ferran Garcia-Pichel

第一单位:Department of Biological Sciences, Northern Illinois University, DeKalb, Illinois, USA

原文链接:https://pubmed.ncbi.nlm.nih.gov/32605986/.


图片


文献总结

自然选择学说在分子生物学时代可以被描述为环境-基因的在漫长进化过程中的相互适应


虽然这一观点被普遍接受,但是需要更多的实证加以支持。


研究者尝试从机制角度论证这个生态学中的基本问题,即环境会促进生物体在基因组水平的进化而这种进化能帮助生物体适应环境。


作者选用了蓝藻作为研究模型,并且观察到了基因组复杂性和生态位之间的联系。


水华蓝藻具有比非水华蓝藻更加复杂且多样的的伪空胞、藻毒素、脂肪酸合成、营养摄取(氨基酸、碳、氮、硫)相关基因


这种基因组复杂性和生态位的相关性或许正提供了生物体在不同环境胁迫下的差异性进化机制,并且可以推广到生态学领域的其他研究。

图片

文献主要成果

(1)   基于不同原则的蓝藻分类

首先,作者从NCBI中收集了43株蓝藻(包括淡水蓝藻和海洋蓝藻)的113个基因组,其中包含45个水华蓝藻的基因组和68个非水华蓝藻的基因组。


之后依据16S rRNA序列相似度制作了进化树,并根据产生水华与否(水华蓝藻为蓝色,非水华蓝藻为红色)和形态不同(Rippka分类,I:出芽生殖的单细胞蓝藻;II:二分裂或多平面分裂繁殖的单细胞;III:无特化细胞的丝状种类;IV:有异形胞无真分枝的丝状种类;V:有异形胞有真分枝的丝状种类)进行了标注。


然而,如果仅仅以是否能产生水华作为标准,不论是形态学分类还是16S rRNA同源性都不能很好地区分水华蓝藻和非水华蓝藻。


图片


图1基于16S rRNA基因序列的43株蓝藻菌株的系统发育

注:水华蓝藻为蓝色,非水华蓝藻为红色。形态学分类则是根据传统的Rippka分类。

(2)   蓝藻相关代谢通路总览

由于本文观察的蓝藻种系不同,因此如果简单比较基因组的大小和序列,种系本身带来的基因组差异必然会强烈干扰环境-功能互作带来的基因组进化。


因此参考Aphanizomenon flos-aquae NIES-81基因注释,作者从SEED和KEGG数据库中收集并观察了19个蓝藻生存相关通路(称为待查通路)和5个蓝藻生存必需通路(称为核心通路)。


作者猜想,环境导致的进化更多地应当出现在非必需通路(待查通路)。而已有研究表明生存必需的通路代谢通路在菌种之间相对保守得多(图2)。

图片

图2 Aphanizomenon flos-aquae NIES-81中的信号通路


(2)   水华蓝藻和非水华蓝藻基因组复杂度存在明显差异

作者对这些基因组复杂性加以定义,将基因注释为蛋白质后重点观察了8项指标:

>NP(通路中的蛋白数量)

>NC(蛋白复合物数量)

>NPC(蛋白复合物中的蛋白数量)

>LP(通路中编码所有蛋白的基因序列长度)>FLP(基因组中的LP占比)

>LC(蛋白复合物中编码所有蛋白的基因序列长度)

>FLC(基因组中的LC占比)

>PC(某一藻种的NC在已报道的通路蛋白中的占比)


这些标定蓝藻基因复杂性的8维数据首先被归一化成0~1的数,然后取平均作为基因复杂性指标(GCI)。


结果发现,在待查通路中水华蓝藻包含461(±57)个蛋白,在基因组中占比14.5;

而非水华蓝藻仅仅包含274(±42)个蛋白基因组占比为10.3%。而作为对照的核心通路,水华蓝藻和非水华蓝藻之间没有显著差异(169,5.3%对160,6%)(表1)。


表1 水华株系与非水华株系核心与待查通路的复杂度比较

图片


当具体到某些通路,5个核心通路、PSI和PSII在水华蓝藻和非水华蓝藻之间。

当然PSI和PSII在不同细菌中的地位是不同的,作为光养生物,PSI与PSII在蓝藻中也许更应该被当做核心通路。

而其他各个核心通路,水华蓝藻明显比非水华蓝藻具有更高的复杂度(表1和图3)。


图片


图3 水华株系和非水华株系24条通路的平均相对基因复杂度(GCI)


(4)   基因复杂度和水华发生率存在正相关性

确定某一种蓝藻能否引发水华仅仅依赖于NCBI的数据上传者显然是不够严谨的,于是作者定义了特定蓝藻的水华发生率(BII)。


各种蓝藻的水华发生率数据来源于Web of science,具体方法是查询菌株名称(第一个),物种名称(如果菌株名称产生的结果不足),或者在少数情况下用属名在网上检索。从结果引用数大于2的结果中计算各个种系蓝藻曾经被报道发生水华的概率作为某一种蓝藻的水华发生率。


基因组复杂度和水华发生率进行相关性分析。

作者发现核心通路、PSI与PSII和水华发生率均没有显著的相关性(P>0.05)。

在待查路径中,除了OSR、DrugR和MetalR外,所有路径的相关性都很显著。然而,只有7种途径(vesicle,toxin,PUFA and AAT,CCM,sulfur,and osmosis)的R2> 0.4),只有2条附加路径的R2>0.25(NF和N)(图4A和B)。

具体地,基因组复杂度与水华发生率的相关性可以以Vesicle和Calvin为例体现出来(图4C和D)。

图片


图4 每个通路中GCI和BII之间的Pearson相关性


通路的复杂性是由构成这条通路的各个基因共同组成的。


作者将有显著差异的vesicle路径和没有显著性差异的OSR通路中的完整组分可视化。如图5所示。在vesicle途径中,所有基因在水华蓝藻中都比非水华蓝藻丰富(Wilcoxon sign rank test,P <0.05)。


对于OSR基因,只有gpx在非水华蓝藻中显著高于水华蓝藻(Wilcoxon sign rank test,P<10-2),而其他基因没有差异(Wilcoxon sign rank test,P >0.05)。


图片


图5 根据水华能力排序,本研究的113个基因组中vesicle(A)和OSR(B)基因


(5)   待查通路复杂度在富营养水体中和表达水平存在相关性。

为了证实基因组复杂度在实际蓝藻水华中是否真正有指示意义,作者在富营养化湖泊和寡营养湖泊中分别做了宏转录组研究,并把水华相关基因的复杂度和其表达量进行了相关性分析。


结果发现,仅仅在富营养化湖泊中,水华相关基因的复杂度和其表达量存在正相关性。


这就构建起了比较严密的逻辑关系:水华基因的更加复杂的藻种(GCI高)——导致水华——故而在湖泊中占比显著上升(表达量高)

蓝藻水华高复杂度的vesicle、PBS、CCM和N也正是其高表达的通路之一,而OSR、metalR甚至MAA等非重要途径的表达水平最低(图6)。

图片


图6 表达水平与GCI的相关性:富营养化湖泊(Lake Erie,A 和 B;Harsha Lake,C 和D),寡营养化淡水湖泊(Sparkling Lake, E and F),寡营养化海水(western Arctic Ocean,Canada,G和H)


读后

长久以来人们普遍接受环境压力或者环境适应会促使生物发生进化,而其根本在于基因组水平的进化。


在自然状态下基因会发生多种突变,产生各种表型而供自然选择。

在这一过程中,发生基因的点突变或导致该基因产物的表达和功能变化;而同源重组、复制异常或是基因转座还会产生另一种形式的基因变异——基因重复,从而产生多拷贝基因

多拷贝基因从个体上讲仅仅是增加了基因的表达量,但是当把时间跨度扩大,多个拷贝的基因各自发生进化就会大大增加群体/物种的基因复杂度


这种复杂度的提升帮助物种提高了对环境改变的应激能力。这也是为什么生物体中会大量出现结构和功能相似但调控和活性又不完全相同的基因家族的原因。

而作为进化中的一环,这种复杂度的提升理应更加容易地被环境选择压力所筛选出来。

因此,当我们讲到具有更高环境适应度/更多功能的物种具有更高的基因组进化度/复杂度时,很容易就被大家所接受。


然而,本文作者则为这种朦胧的概念提供了确实的证据,并且在环境中找到了实证。

这种创新可能是本文能够被闪电接收并发表的重要因素(2020年5月12日投稿,5月26日即被接收,6月30日即见刊)。


此外,本文的数据为比较基因组学中的“相关性导致复杂性”提供了支持

它描绘了一种比较基因组学和生态学结合起来的工具


在更广的范围内,本文的方法可以与宏基因组测序组装的基因组相结合来推断基因组复杂性和生态位之间的联系,从基因和基因组层面挖掘和预测生态学问题,开辟一个全新的框架体系

虽然这种方法适用于蓝藻形成水华的情况,但原则上没有理由不在其他微生物和生物类群中找到应用。


图片