我正在尝试匹配表单的网址
r'https://.*.mysite.com'
但是,人们会注意到,如果没有子域.mysite.com
则无效。如果有一个子域,例如 sub.mysite.com
,只有这样我才想要在 mysite 前面有一个点,否则,我希望在 https://
和 mysite.com
之间有 0 个点(或更一般地说,字符(
我该如何实现此目的?
这似乎不是一个特定于Python的问题,而更像是一个正则表达式的问题。
您可以修改表达式以选择性地接受子域:
https://([^.]+.)?mysite.com
或者允许多级子域:
https://([^.]+.)*mysite.com
此外,如果不想使用捕获组,可以使用非捕获组:
https://(?:[^.]+.)*mysite.com