r-这些数字范围相互重叠

我一直在使用两个不同的靶标预测程序来预测基因上的结合位点，并使用R来处理我得到的结果

问题是，这些程序为每个基因提供了不同数量的靶点，而且位置略有不同。我想做的是看看这些站点是否相同，或者至少，如果我有"开始"位置和"停止"位置，这些范围在程序之间是否重叠。

假设我有两个程序X和Y；

X预测两个位点，x1是两个位点的起始位置，x2是停止位置。与y 相同

x1<-c(1521,1259)
x2<-c(1544,1282)
y1<-c(1825,1522,1259,362)
y2<-c(1848,1543,1282,384)

因此，两个X站点在Y中重叠。并在表中输出这些位置：

|   x1     |   x2     |   y1     |   y2     |
|   1521   |   1544   |   1522   |   1543   |
|   1259   |   1282   |   y1259  |   1282   |

我最初的想法是，如果每个程序只有一个站点，那么执行以下操作会告诉我它们是否重叠。（y的停止位置，应大于开始位置x，x的停止位置大于y）

x1 <= y2 && y1 <= x2

我不知道我怎么能对我的问题做同样的事情，至少，如果不写很多循环和if的话。

IRanges软件包（以及基因组数据的GenomicRanges，当染色体和可能的链很重要时）允许您定义范围

library(IRanges)
x <- IRanges(x1, x2)
y <- IRanges(y1, y2)

并询问有关他们的问题

y %over% x     # any type of overlap
y %within% x   # strictly within

有关更多详细信息，请参阅?findOverlaps、软件包小插曲（来自上面的登录页）、这些出版物a、b的一般介绍，以及如果靶场基础设施看起来有用，则可访问Bioconductor支持网站。

相关内容