请问生物测序中的de novo genome assembly是什么意思?还有coverage?

学习 时间:2026-04-06 17:04:01 阅读:1282
请问生物测序中的de novo genome assembly是什么意思?还有coverage?最好举例说明下……

最佳回答

虚拟的斑马

壮观的蚂蚁

2026-04-06 17:04:01

楼下回答了一些,我尽自己知道的补充一点。denovo字面意思是全新,专业一点就是从头测序。详细点就是对未知基因组序列进行测序,利用生物信息学分析手段,对序列进行拼接、组装,从而获得其基因组的图谱。另外,你追问的问题,其实有些人会混淆两个概念:测序的覆盖度(coverage)和测序的深度(depth)。对于coverage,由于大片段拼接的gap(空白或者缺口)、测序读长有限、重复序列等问题的存在,测序分析后组装得到的基因组序列通常无法完全覆盖所有区域,覆盖度就是最终得到的结果占整个基因组的比例。例如一个人的基因组测序,覆盖度为98。5%,那么说明该基因组还有1。5%的区域通过我们的组装和分析无法得到;对于depth,就是被测基因组上单个碱基被测序的平均次数,比如某样本的测序深度为30X,那么就是说该样本的基因组上每一个单碱基平均被测序(或者说读取)了30次,注意,是平均。当然了,depth也有最大和最小值,这个都可以由信息分析得到。其实也就是为了提高准确率什么的,一般15X就差不多了。就这些了,还有什么, 再问: 多谢你的回答,太专业了,呵呵,还有一个问题,就是测序得到的reads,是不是长度不一定相等?然后reads对应于原来的基因位置上,reads的个数也不同吧?也就是说,有的位置得到的reads多,kmers多,就是high coverage? 有的位置对应得到的reads少,kmers少,就是low coverage? 再答: 测序得到的reads这个要看你测序方法了。以solexa为例的话,看你是构建多大的文库(或者你打断的片段长度),长度具有随机性,但是一般构建文库时候会选择一个长度区域。 另外,LZ要仔细看呀,上面回答了说覆盖度就是最终得到的结果占整个基因组的比例,是个总的概念。 另外,kmers与覆盖度木有关系。 本人自己的看法:low coverage 就是说有些地方没覆盖,而不应该是reads多少的意思吧。这句话仅供参考

最新回答共有2条回答

  • 矮小的诺言
    回复
    2026-04-06 17:04:01

    楼下回答了一些,我尽自己知道的补充一点。denovo字面意思是全新,专业一点就是从头测序。详细点就是对未知基因组序列进行测序,利用生物信息学分析手段,对序列进行拼接、组装,从而获得其基因组的图谱。另外,你追问的问题,其实有些人会混淆两个概念:测序的覆盖度(coverage)和测序的深度(depth)。对于coverage,由于大片段拼接的gap(空白或者缺口)、测序读长有限、重复序列等问题的存在,测序分析后组装得到的基因组序列通常无法完全覆盖所有区域,覆盖度就是最终得到的结果占整个基因组的比例。例如一个人的基因组测序,覆盖度为98。5%,那么说明该基因组还有1。5%的区域通过我们的组装和分析无法得到;对于depth,就是被测基因组上单个碱基被测序的平均次数,比如某样本的测序深度为30X,那么就是说该样本的基因组上每一个单碱基平均被测序(或者说读取)了30次,注意,是平均。当然了,depth也有最大和最小值,这个都可以由信息分析得到。其实也就是为了提高准确率什么的,一般15X就差不多了。就这些了,还有什么, 再问: 多谢你的回答,太专业了,呵呵,还有一个问题,就是测序得到的reads,是不是长度不一定相等?然后reads对应于原来的基因位置上,reads的个数也不同吧?也就是说,有的位置得到的reads多,kmers多,就是high coverage? 有的位置对应得到的reads少,kmers少,就是low coverage? 再答: 测序得到的reads这个要看你测序方法了。以solexa为例的话,看你是构建多大的文库(或者你打断的片段长度),长度具有随机性,但是一般构建文库时候会选择一个长度区域。 另外,LZ要仔细看呀,上面回答了说覆盖度就是最终得到的结果占整个基因组的比例,是个总的概念。 另外,kmers与覆盖度木有关系。 本人自己的看法:low coverage 就是说有些地方没覆盖,而不应该是reads多少的意思吧。这句话仅供参考

上一篇 she is less interted in computers than i am 大虾们

下一篇 英语翻译But never,ever ,warn marriage law consultant ,should you