关于比较基因组分析/泛基因组分析可以使用的软件问题

随着个体化医疗和临床癌症基因組分析研究的发展基因检测服务需求越来越广泛。基因组分析学技术和靶向

[单选] 关于预加氢高分液面过低的处理下列操作正确的是()。
[单选] 当空气与燃料气的混合气体从燃烧器喷头流出的速率过大时燃烧器易发生()现象。
[多选] 关于预加氢高分液面波动大时的处理下列叙述正确的是()。
[单选] 如卸出的重整催化剂发生自燃最好用()灭火器。
[单选] 压缩机按其结构和操作原理分类可分为()。
[單选] 二氯乙烷的爆炸极限范围是()
[多选] 往复式压缩机卸荷器的工作原理是()。
[单选] 压缩机按其结构和操作原理分类可分为()。
[單选] 关于精制油硫含量超标下列处理方法错误的是()。
[单选] 下列情况下应投用预加氢脱硫罐的是()。
[多选] 关于离心泵停用的注意倳项下列叙述正确的是()。
[单选] 乙醇在催化重整装置中的作用是()
[单选] 某分馏塔的塔顶回流量为5t/h,塔顶产品量为10t/h回流比为()。
[单选] 在半再生重整装置中如果注水增加1PPm,那么重整循环氢中水相应的会增加()PPm左右
[单选] 二甲基二硫醚在催化重整装置中的作用,主要是()
[单选] 塔、罐、容器等设备和管线需要动火时,应进行化验分析当可燃气体爆炸下限大于4%时,其被测浓度()为合格
[多选] 離心式压缩机的转子主要包括()。
[单选] 下列情况下应投用预加氢脱氯系统的是()。
[多选] 催化重整装置在停工过程中的注意事项有()
[单选] 加热炉吹灰器中,长期在加热炉内的是()吹灰器
[多选] 轴向反应器积垢篮的作用是()。
[单选] 下列选项中不会造成精制油氮含量超标的有()。
[多选] 离心式压缩机的转子主要包括()
[多选] 下列条件下,有利于预加氢蒸发脱水塔中水的脱除的是()
[单选] 炼油笁业上常用的换热器管束的排列方式是()。
[单选] 在半再生重整装置中如果注水增加1PPm,那么重整循环氢中水相应的会增加()PPm左右
[多選] 预加氢反应系统临时停工保压的介质可选用()。
[单选] 预加氢脱氯剂装填时必须用帆布软管而不允许直接倒的原因是()。
[单选] 浮头式换器是化工装置中常用冷换设备其特点是()。
[单选] 机泵定期切换的目的是()
[单选] 设计加热炉时,当加热炉热负荷大于10MW时应设()个防爆门。
[单选] 离心泵正常切换时下列叙述正确的是()。
[多选] 下列选项中会造成预加氢循环机带液的是()。
[单选] 离心泵正常切换时下列叙述正确的是()。
[多选] 预加氢反应器产生沟流的危害有()
[多选] 关于预加氢空速过小的危害,下列叙述正确的是()
[單选] 关于预加氢原料氮含量偏高的说法,下列叙述错误的是()
[单选] 预加氢进料硫含量上升时,下列调整正确的是()
[多选] 重整催化劑烧焦时,不能使用水蒸汽作为循环气的原因是()
[单选] 造成重整汽油稳定塔底油溴价上升的原因是()。
[单选] 如卸出的预加氢催化剂發生自燃最好使用()灭火器。
[多选] 关于添加二氯乙烷溶剂的注意事项下列表述正确的是()。
[单选] 下列选项中可能会造成重整催囮剂积炭速率突然上升的是()。
[单选] 热油泵备用时应()。
[单选] 轴向反应器积垢篮在装入反应器内时积垢篮内部应是()。
[多选] 关於烟气腐蚀机理下列表述正确的是()。
[单选] 如卸出的预加氢催化剂发生自燃最好使用()灭火器。
[单选] 重整进料为30m
稳定塔底油外送量为26m
,稳定塔底油液收率为()
[单选] 轴向反应器积垢篮应置于反应器床层的()。
[单选] 关于精制油氯含量偏高下列处理方法错误的昰()。
[单选] 重整反应系统正常停车时一般降温速率控制在()℃左右。
[单选] 二甲基二硫醚的硫含量为()%
[单选] 预加氢反应器产生沟鋶的主要原因是()。
[多选] 提高压缩机的容积比会使()。
[多选] 关于烟气腐蚀机理下列表述正确的是()。
[单选] 具有超前调节作用能克服被控参数调节过程的滞后现象的是()。
[单选] 下列情况下应投用预加氢脱氯系统的是()。
[单选] 不属于往复式压缩机压缩机组的輔助系统的是()
[单选] 浮头式换器是化工装置中常用冷换设备,其特点是()
[单选] 正常情况下,在重整末反中一般不进行()反应

近年来随着多种植物参考基因組分析的不断公布及同种不同个体植物基因组分析间的相互比较,人们逐渐认识到单一参考基因组分析不能代表物种内的多样性这导致叻泛基因组分析概念的产生。随后在三代测序技术的助力下,拓展了泛基因组分析的深度和精度植物泛基因组分析也迎来了黄金发展期。2014年开启了作物泛基因组分析研究历程。自2014年开展泛基因组分析研究至今先后开展了玉米、大豆、油菜、小麦(六倍体面包小麦)、短柄草、水稻、番茄、芝麻、木豆等的泛基因组分析研究,有助于充分挖掘遗传变异资源;鉴定品系特有性状调控基因;通过对不同环境丅野生物种基因分布进行研究有助于培育更适应不同环境气候变化的作物。未来泛基因组分析逐渐取代单一参考基因组分析,成为研究植物进化、选择与基因功能的“新标准”

genome)。核心基因:在所有动植物品系或者菌株中都存在的基因;非核心基因:在1个以及1个以上嘚动植物品系或者菌株中存在的基因通过,分析核心基因和非核心基因的基本情况并从特有基因序列的角度来研究物种内的差异。一般来说核心基因组分析控制着生命体基本生成代谢的功能。另外结构变异中的存在/缺失变化(presnece/absence variation)是泛基因组分析的重点研究对象,因为可變基因组分析可能就是使个体产生不同性状(抗病性抗寒性等)的原因。

图1 利用多个个体构建泛基因组分析

02 为什么要开展泛基因组分析測序

在漫长的进化过程中,由于地域因素环境因素等的影响,每个个体都形成了极其特别的遗传性状单一个体的基因组分析已经不能涵盖这个物种的所有遗传信息。多项研究表明选取野生近缘种(CWRs)进行泛基因组分析分析,能够检测在驯化和育种过程中的基因保留囷丢失支持对丢失多样性的描述和将基因重新引入现代品种的潜力。例如在南美洲和中美洲番茄驯化过程中与风味有关的基因发生丢夨,后来又被重新引入同时,对不同环境下野生物种基因分布进行研究有助于培育更适应不同环境气候变化的作物。比如PAV基因容易富集在对非生物和生物胁迫反应有关的通路中,尤其是抗病相关通路类似的结论在单子叶、双子叶甚至人类中都有发现。技术的发展甴于基因测序变得更加廉价,为近年来火爆的泛基因组分析的研究提供了可能性尤其是,三代测序技术(PacBio or Nanopore Technology)无论在基因组分析组装还是茬结构变异检测上具有极大的优势成了现今泛基因组分析研究的核心技术平台。

泛基因组分析通过对不同品种基因组分析进行测序、组裝然后将组装好的基因序列进行整合注释,进而获取这个物种全部的遗传信息并且对每一个个体间遗传变异信息进行解析

03 植物泛基因組分析的构建方式

概况来看,植物目前构建泛基因组分析的方式有三种:迭代组装、多个体De novo、图形基因组分析

· 迭代组装指将多个样本嘚下机数据比对到一个参考基因组分析后,将未比对上的reads组装成新的contigs通过将这些新的contigs添加到原始的参考序列中,就可以构建一个泛基因組分析;

· 多个体De novo即对多个样本同时进行组装注释从全基因组分析层面识别PAV,也是目前运用最广的方法;

图2 植物泛基因组分析的构建方式

04 作物泛基因组分析的材料选择

泛基因组分析可以是开放的或关闭的(图3)当泛基因组分析关闭时,对足够数量的个体进行测序几乎鈳以获得整个基因/序列信息,可以预测泛基因组分析的理论大小相反,当泛基因组分析开放时每增加一个新的个体,新的基因就会被整合到泛基因组分析中使得不能预测最终的泛基因组分析大小。

图3 泛基因组分析大小与个体数量的关系

影响泛基因组分析规模的因素之┅是非核心基因所占百分比 (在作物泛基因组分析的研究中非必需基因组分析的比例从8%上升到61%),其中样本量是泛基因组分析究的重要因素。在构建泛基因组分析开始随着鉴定新基因的个体数目的增加,泛基因组分析的大小也随之增加但核心基因的百分比随之下降。

2018)對于作物研究,随着测序个体数量的增加鉴定出的新基因数量趋于减少,这表明存在有限数量的基因组分析超过此数量的基因组分析後,将更多的基因组分析纳入分析中将不会导致泛基因组分析的进一步扩张

材料的选择对pan-genome研究的检测效率和完整性也有十分重要的影响:1. 亲缘关系远近:亲缘关系近的材料的选择将会低估pan-genome的大小;2. 野生种质与栽培种质的结合:野生种质和栽培种质的结合可产生更大种规模嘚pan-genome,其非核心基因的比例比单纯的利用栽培作物材料的高出很多

05 泛基因组分析的分析内容

1. 泛基因组分析特征分析

泛基因组分析分析可以囙答三个重要问题,以助于了解物种特性:

(1)核心基因组分析的大小是多少换句话说就是有多少基因/基因家族在所有个体中都存在;

(2)泛基因组分析的大小是多少,在这些物种里共有多少基因/基因家族;

(3)随着每个新个体的加入将有多少基因/基因家族被加入泛基洇组分析。

同时泛基因组分析研究会对核心基因组分析和可变基因组分析进行比较,包括:

(1)基因特性比如平均基因长度、外显子數目;

(3)同义替换率 dS、非同义替换率 dN、非同义替换率与同义替换率比值 dN/dS;

2. 全面准确的变异检测

泛基因组分析研究可以得到物种全面且准確的变异信息 (SNP、Indel、CNV、PAV)。与重测序变异检测相比泛基因组分析研究基于基因组分析序列进行变异分析能够大幅度提高变异检测的准确性,鉯及大结构变异的检出性比如,2019年发表的番茄泛基因组分析研究中PAV(presence / absence variations)分析通过统计群体中每个个体的基因组分析包含哪些基因,对个體基因组分析进行分型并进行后续的进化分析。在群体中各个个体相对差异较大时使用PAV分析比使用SNP等变异信息来分析更加能够体现群體内部的差异。而在本研究中通过对野生、早期栽培和现代栽培的番茄进行PAV比较,可以揭示驯化种植过程中番茄基因组分析发生变化的過程野生番茄品系(SP和SCG)包含的基因显著较多,显示番茄驯化中存在基因丢失过程

图4 4类番茄基因数量的小提琴图

泛基因组分析分析能鑒定出参考序列中不存在的基因,对这些新基因进行功能分析也是其研究的焦点比如,在2018年水稻泛基因组分析文章中研究者鉴定出大量基因不存在于参考基因组分析“日本晴”,其中一些新基因具有重要的功能包括抗涝性基因 Sub1A-1, Snorkel-1, Snorkel-2和缺磷耐受性基因 Pstol1(图5)。

图5 水稻泛基因組分析中6个功能特征基因的 PAV

泛基因组分析可以对物种进行广而深入的进化研究以了解物种的起源与演化。同时还能结合生物地理学分析物种传播途径的演化。泛基因组分析研究收集到的数据是较全面的因此,在某些情况下可以解决物种进化分歧的问题

5. 泛基因组分析進阶分析

泛基因组分析对存在/缺失变异的分析大多集中在编码区域,然而越来越多的人认识到顺式调控元件和重复序列在健康和疾病以忣作物驯化和改良中的重要性。因此泛基因组分析的研究也扩展到非编码序列。

核心基因和可变基因的调控网络构建

泛基因组分析分析嘚到了大量核心基因和可变基因这些基因都行使着什么样的功能,以及相互之间有什么样的联系这些问题将在未来泛基因组分析的研究中得到解答。可变基因的作用之一是提供适应环境变化和新的生态位所需要的表型可塑性为了履行这一功能,可变基因需要整合到现囿的生物学通路和调控网络中

06 植物泛基因组分析的发展趋势

泛基因组分析逐渐取代单一参考基因组分析,成为研究植物进化、选择与基洇功能的“新标准”未来植物泛基因组分析学的发展可重点关注以下3个方面:

(1)泛基因组分析学数据的存储和可视化:重点是对泛基洇组分析进行精确和一致性的功能注释,以探索变异基因更广泛的功能

(2)综合基因组分析学方法,将基因的特性(如表达水平、生物網络中的连接性和序列保守性)与功能联系起来:即泛基因组分析的研究不应只局限在基因部分基因组分析的调控区域也是诸多农艺性狀的决定因素。

(3)泛基因组分析的“跨属”研究:由于测序成本和计算资源的制约目前植物泛基因组分析集中在“种”水平,而未来開始“属”甚至“科”水平的泛基因组分析可以使得我们回答植物学最古老的问题:什么基因造就了植物?

07 植物泛基因组分析的数据库

近日来自上海交通大学的两个跨学科、跨专业科研团队,通过数年的协作科技攻关开发了一套针对大规模人类基因组分析深度测序数据的全新分析系统——人类泛基洇组分析分析系统(Human Pan-genome Analysis system,简称HUPAN)该方法学的建立为解析人类基因组分析中尚未被发现的“暗物质”提供了重要研究工具。该项研究成果于2019姩7月31号在线发表于国际基因组分析学研究权威刊物《Genome Biology》(影响因子14.028)该研究工作是由上海交大生命科学技术学院韦朝春教授课题组和医學院附属瑞金医院于颖彦教授课题组联合完成。韦朝春教授与于颖彦教授为该文章共同通讯作者博士生段忠取为该文章第一作者。

众所周知人类基因组分析计划宣告完成后产生了一个基于有限个体的人类参考基因组分析序列,这也是之后众多分子生物学实验研究的参照基础但随着对人类基因组分析测序研究的广泛开展、测序个体数量的不断增加,科学家们发现现有的人类基因组分析参考序列尚不够唍整,特别是在一些特定的人群或个体基因组分析中被测序到现有人类基因组分析参考序列中缺失的片段也就是说,人类基因组分析的序列其实比已知的基因组分析参考序列要复杂尚有很多未知序列(或者说暗物质)有待于科学家们通过不断的深化研究加以发现。

泛基洇组分析(Pan-genome)是指某个群体中所有个体基因组分析的总和随着测序技术的进展,针对人类某个群体的多个个体基因组分析的测序数据不斷积累增加给泛基因组分析研究提供了前所未有的契机。然而人类全基因组分析测序数据量庞大,现有针对如此大型基因组分析数据進行拼接研究的方法学有限如果研究方法不加以创新,在分析过程中容易引入较多的拼接错误且分析速度缓慢。为此该联合研究团隊进行了分析方法的创新,他们首先对原有真核生物泛基因组分析分析流程进行了改进包括引入节约内存的拼接方法,可直接对每个个體的所有测序数据进行拼接以降低拼接错误优化了泛基因组分析分析步骤,明显提高了海量测序数据的分析速度和准确率


新型分析方法对185个中国汉族人的全基因组分析深度测序分析,同时对开放数据库内90个中国汉族人全基因组分析深度测序数据测试显示在中国汉族人铨基因组分析测序数据中至少存在29.5Mb不同于人类参考基因组分析的新序列,暨人类基因组分析参考序列中漏掉的序列通过新基因预测分析,发现188个新基因且新序列中约40%仅见于中国汉族人群。


该新型方法的创立不仅仅为深入研究人类进化、人类迁徙规律、种族基因组分析差異以及新基因与人类疾病相关性提供了重要工具还为其它具有较大基因组分析的高等动物泛基因组分析研究提供了重要分析工具。


该项研究是在上海交通大学医工交叉重点项目、国家科技部及卫健委重点研发计划、国家自然科学基金委以及上海市科委重点项目支持下完成项目实施过程中还得到上海市转化医学协同创新中心和上海交通大学高性能计算中心的大力支持。


韦朝春上海交通大学生命科学技术學院生物信息学与生物统计学系教授/博士生导师。先后于北京大学和美国华盛顿大学(圣路易斯)获得数学学士、信息处理硕士和计算機科学博士学位主要研究方向为基因组分析学和进化基因组分析学。具体研究内容包括基因组分析中的功能因子的识别及其进化分析、嫃核生物泛基因组分析学、肿瘤基因组分析学和宏基因组分析学等


于颖彦,上海交通大学医学院附属瑞金医院教授/博士生导师上海消囮外科研究所副所长,中国抗癌协会胃癌专业委员会委员中国医药生物技术协会生物样本库分会及慢病管理分会常委。上海市浦江人才與上海市优秀学术带头人从事消化病理、肿瘤分子分型、生物标志物和转化医学研究。承担国家重点研发计划精准医学专项和慢病专项国家自然科学基金、上海市科委重点项目及上海交大医工交叉重点项目等。


我要回帖

更多关于 基因组分析 的文章

 

随机推荐