小贝子编程

如何使用urllib.request获取文件的URL列表？

本文关键字：URL 列表文件获取何使用 urllib request python python-re
更新时间 : 2023-09-18
英文 : How to get list of file's url using urllib.request?

from urllib.request import urlopen
import re
urlpath =urlopen("http://blablabla.com/file")
string = urlpath.read().decode('utf-8')
pattern = re.compile('*.docx"')
onlyfiles = pattern.findall(string)
print(onlyfiles)

目标输出

['http://blablabla.com/file/1.docx','http://blablabla.com/file/2.docx']

但我有这个

[]

尝试此操作时收到此错误消息。

re.error: nothing to repeat at position 0

这一行的恒星：

pattern = re.compile('*.docx"')

显然是一个已知的蟒蛇错误：

查看以下相关答案：regex错误-无需重复

使用word或a-zregexp:尝试此操作

pattern = re.compile('w*.docx"')
# or
pattern = re.compile('[a-zA-Z0-9]*.docx"')

最新更新

使用numpy自定义2D矩阵操作
不能分割forloop.django模板中的计数器?
在Python中，仅对列中的某些值将厘米转换为英寸
r语言 - 使用Hugo修复RSS提要中断开的相对链接
我能把一个小块从一页移到另一页吗?
你能帮我一个 sed 命令来搜索一行中的字符串"ABC = 0x000"并执行字符串中零的位置替换吗
如何制作用于从帖子页面访问帖子作者个人资料页面的URL
我已将我的注册详细信息保存在csv文件中，登录时我想验证数据是否有效.但我面对的是错误
我有两个本地仓库，一个在学校，一个在家里，以及github上的远程仓库，我如何从一个本地仓库同步到另一个本地仓库.<
android WebView:复制到剪贴板[https://poe.com]
为什么我的web scraper将所有内容写在一行中?
无法获取…的applicationId项目类型:PROJECT_TYPE_LIBRARY
实例化prefab内部的对象
如何在html文本区的左上角放置按钮?
如何使用Nodejs API获取数据
为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合
类型 'String' 不是类型转换中 'List<String>' 类型的子类型？
__init__是一个类属性吗?
如何格式化LocalDateTime yyyy-MM-dd HH:mm到dd-MM-yyyy HH:mm作为字符串的整个
为什么客户端组件不工作- NextJS 13.3.0实验特性
跨行扩展字典，维护其他列- python
如何将open()加载的数据编码为UTF-8?
这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?

如何使用urllib.request获取文件的URL列表？

相关内容

最新更新

热门标签：