Genome Biology是BioMed Central的旗舰刊之一,最新影响因子11.131。本周推送Genome Biology最新文章。
CHiCAGO:在Capture Hi-C数据中对DNA循环相互作用的稳健检测
Capture Hi-C(Chi-C)是一种用于针对涉及基因启动子等目标关注区域的染色体相互作用,以高分辨率进行全局分析的方法。CHi-C数据的信号检测面临很多在使用其他Hi-C类技术时不曾遇到的统计方面挑战。我们介绍用于具体适应Chi-C实验的归一化和多重检测的背景模型和算法。我们在CHiCAGO(http://regulatorygenomicsgroup.org/chicago)中实现这些程序。CHiCAGO是一种用于在Chi-C中对相互作用进行稳健检测的开源包。我们通过证明使用该方法检测出的启动子-相互作用区富含调控特征和疾病相关SNP,对CHiCAGO进行了验证。
Mash:利用MinHash技术的基因组及宏基因组距离快速估算
Mash对MinHash降维技术加以扩展,使之包含成对突变距离和P值显著性检验,从而能够实现对大规模序列集合的高效聚类和检索。Mash将较大的序列和序列集合缩减为较小的代表性草图,从中可以快速估算出全局突变距离。我们展示若干用例,包括在33 CPU h内聚类全部54118个NCBI RefSeq基因组;使用经汇集或未经汇集的Illumina、Pacific Biosciences及Oxford Nanopore数据进行实时数据库检索;以及按组成对数百份宏基因组样品进行可扩展聚类。Mash根据BDS许可免费发布(https://github.com/marbl/mash)。