小贝子编程

使用re.findall在Python中创建链接抓取器

本文关键字：创建链接抓取 Python re findall 使用 python
更新时间 : 2023-08-28
英文 : Using re.findall to create a link grabber in Python

所以我将尝试为朋友创建这个刮刀。基本上，我希望它从一个网站上获取所有链接。就是这样。

我知道它会有点像：

links = re.findall()
print links

我在网上找到了re.finall，但不知道如何使用它！任何指向正确方向的指针都会有很大帮助！

试试BeautifulSoup。它处理糟糕的HTML，并为解析HTML提供了一个非常好的界面。另外，它真的很容易使用。这是你的刮刀（直接来自文档）：

for link in soup.find_all('a'):
    print(link.get('href'))

最新更新

Python问题我如何循环回我的代码?
asyncpg.exceptions.InvalidAuthorizationSpecificationError Py
为什么我的阅读更多按钮不工作?
如何得到拆分字符后的单词
在列表框之间移动项
设置 SKEmitterNode 的 'targetNode' 会导致奇怪的 'zPosition' 行为
我无法在斐波那契数列 python 中加强术语
用Jest测试使用jquery获取数据的异步函数
c#与HTML敏捷包不能得到div类的值
Python 中的 OOP 层次结构
我如何动画下拉菜单的高度使用顺风css
无法从字符串比较失败的字符串中删除"—"
无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?
无法使用 conda env 导入 OCI 笔记本会话中的模型配置详细信息
c - while循环中VSC的分段错误
无法将url数据获取到模型类中
如何将DataGridTextColumn绑定到WinUI3中绑定的对象中的方法?
错误在cobol程序上打开VB文件来处理XML文件
while循环在python中没有爆发
yii2查询具有多个非和或的数据提供程序
Libgdx:渲染方法
Pycharm 错误：预期类型 [类名] 改为"str"
运行我的代码时出现错误:未知的自定义元素
在Selenium 4中使用Behat和Mink Selenium2驱动程序为Microsoft Edge浏览器运行测试
宽度未知的可变列数
我必须在.env文件中存储哨兵公钥吗?
Mongodb子文档没有自动生成对象id Typegoose/ mongoose
类型中构造函数的参数 0 需要找不到类型为"org.hibernate.SessionFactory"的 Bean

使用re.findall在Python中创建链接抓取器

相关内容

最新更新

热门标签：