我正在编写一个基于 Java 的 Web 服务器监视器应用程序,该应用程序应该能够检测用户在特定时间范围内以特定顺序浏览一组给定页面的时间。为此,我正在使用 Esper 库。我对查询的最佳表述有些怀疑。
我首先声明了一个"Access"对象,用于存储到达我的 Web 服务器的 HTTP 请求的所有信息。每当向服务器发出新请求时,都会实例化一个新的 Access 对象,并将其作为事件发送到 EPL 处理核心。
假设我想跟踪浏览页面 A、页面 B 和页面 C 的所有用户。处理此类案件的最佳方法是什么?我是否需要执行多个联接,每个联接一个,如以下示例所示?
select * from Access(request='GET /A HTTP/1.1').win:time(30 sec) as a1,
Access(request='GET /B HTTP/1.1').win:time(30 sec) as a2,
Access(request='GET /C HTTP/1.1').win:time(30 sec) as a3
where a1.IP=a2.IP AND a2.IP=a3.IP
select * from pattern[ every
a=pageA ->
b=pageB(a.IP=b.IP) ->
c=pageC(a.IP=b.IP and c.IP=b.IP) within timer.interval(30s)];
如果您想按特定顺序排列,希望这可能会有所帮助。
当顺序未定义时使用连接,即用户可以按任何顺序浏览 A/B/C。
使用模式(EPL 或基于正则表达式的匹配识别)来检测特定顺序。