RegEx从URL中间剥离文本



我有一个客户,她的网站从Blogger移动到Wordpress博客。我在Blogger中放了一些代码来将访问者重定向到正确的Wordpress帖子/页面。所以当Blogger重定向一篇文章时,它会显示为www.domain.com/?bloggerURL=/yyyy/mm/the-post-slug.html

有了这个正则表达式,我成功地返回了正确的Wordpress URL: www.domain.com/yyyy/mm/the-post-slug(带"?bloggerURL=/" and ".html"已删除)

^?bloggerURL=/(.*).html$

博客页面得到重定向像www.domain.com/?bloggerURL=/p/the-page-slug.html我试着只是添加/p到Regex剥离这种情况下也,但它不工作。

^?bloggerURL=/p/(.*).html$
例如,www.domain.com/?bloggerURL=/p/about.html应该重定向到www.domain.com/about,但是URL仍然是www.domain.com/?bloggerURL=/p/about.html

我可能错过了一些简单的东西,让它捡起字符串的第一部分并删除它。我是否需要添加/删除某些内容才能使该案例工作?

只是在重温那些悬而未决的老问题…希望你已经解决了这个问题,但如果没有,我看到的唯一问题是正则表达式的非转义斜杠。我认为你需要使用:

^?bloggerURL=/p/(.*).html$

最新更新