我得到这个网站的HTML代码-
https://theatrevazrajdane.bg/%D1%82%D0%B2%D0%BE%D1%80%D1%87%D0%B5%D1%81%D0%BA%D0%B8-%D1%81%D1%8A%D1%81%D1%82%D0%B0%D0%B2/%D0%B0%D0%BA%D1%82%D1%8C%D0%BE%D1%80%D0%B8/2代码为$html = file_get_contents($url)
,然后我运行一个简单的正则表达式不工作,我不知道为什么。
此代码输出- FALSE
preg_match('/actor/miu', $html);
和这个代码输出- TRUE
str_contains($html, 'actor');
你知道这可能是我多次检查HTML的原因吗?这是正确的HTML。
这个页面有unicode问题。
尝试preg_match('/actor/mi', $html);