如何根据python的组合字符串找到正确的网站链接



我有一个名字和姓氏的列表,应该用于撰写网站链接。但有时有些用户并不总是遵循命名规则,最后,他们的网站名称与预期的名称不匹配。

这里有一个例子:以免说名字是John,姓是Paul。在这种情况下,网站 URL 应johnpaul.com。但有时,使用johnpaul.compauljohn.com,或john-paul.com

我想自动化这些网站上的一些流程。其中绝大多数是正确的,但有些则不正确。当它不正确时,我只是谷歌预期的URL,这通常是我在谷歌上得到的第一个或第二个结果。

我问自己是否可以发出Google请求并使用python检查2或3个第一个链接以获取实际URL。关于如何制作这样的东西的任何想法?

我的代码现在如下所示:

for value in arr:
try:
print requests.get(url).status_code, url
except Exception as e:
print url, " is not available"

我会选择endswith()

string = "bla.com"
strfilter = ('.com', '.de') # Tuple
if string.endswith(strfilter):
raise "400 Bad Request"

这样,您可以过滤掉.com.NET 等错误。

最新更新