小贝子编程

我想得到CNN新闻文章的所有链接

本文关键字：链接文章想得到 CNN 新闻 python beautifulsoup python-newspaper
更新时间 : 2023-09-16
英文 : i want to get CNN news article all link

我想得到CNN新闻文章所有链接

例如

在此链接中

https://edition.cnn.com/search/?q=%20news&size=10

我可以显示最新的 10 条新闻

获取新闻链接我尝试了两种方法。

html_page = urlopen(url)
soup = BeautifulSoup(html_page, "lxml")
cnn_paper = newspaper.build(url, memoize_articles=False)  # ~15 seconds
n_list = []
for article in cnn_paper.articles:
n_list.append(article.url)

和

req = Request(url)
html_page = urlopen(req)
soup = BeautifulSoup(html_page, "lxml")
links = []
for link in soup.findAll('a'):
links.append(link.get('href'))

但我无法获得新闻链接

如果你去下一页，我只能得到相同的链接

试试这个：

for link in soup.find_all('a'):
links.append(link.get('href'))

最新更新

我可以在共享媒体目录DCIM或Android的下载目录下编程创建空子目录吗?
错误:太多的重新渲染.React限制了渲染的次数，以防止无限循环.带有嵌套函数的自定义钩子
(Python 3.8)如何将变量转换为没有分隔符的列表?
解决Docker层缓存在Azure Pipeline中不工作的问题
Jetpack compose:可以设置下拉菜单的高度，以显示下一个项目
如何平嵌套的可观察对象，从RXJS
为什么我的解决方案不正确的旅游切片练习?
我如何使用sbt命令，如清洁和编译在我的自定义sbtplugin
Angular语言 - 根据给定的数据自动填充嵌套表单
node-gyp configure将错误:在VisualStudioFinder中生成EPERM
Spring WebClient检索封装在results属性下的json对象
尝试设置BlazorMonaco编辑器时"ReferenceError: monaco is not defined"
Pandas以正确的顺序创建一个列的DataFrame
在clojure中，vector前面的quote是什么意思?
在模板前使用隐式转换
r语言 - 为什么我的生存曲线没有显示为分层分类?
触发通过外部记录创建API提交脚本之前/之后
为什么esp8266客户端没有连接到服务器?
react-native-map-clustering的性能问题
如何在Flutter中设置图像选择器中的图像的最大大小
dotenv:命令在nestjs项目中找不到
测试苗条的动态部件
urllib.error.HTTPError:HTTP错误403:禁止使用urllib.requests
无法写入日志目录- symfony 5
写JSON例如persondata的正确方法是什么?
Django Password Expiry
如何使用python为XML文件中的现有文本添加XML元素
是可能的，如果是这样，是否有一个性能优势，结合最小的API和经典控制器?
如何从本地存储中删除一个多维数组的按钮点击?
反应.Ok总是正确的，即使是故意使用错误的国家

我想得到CNN新闻文章的所有链接

相关内容

最新更新

热门标签：