小贝子编程

如何在没有类的 span 标签中提取 href 和标签

本文关键字：标签提取 href span python html web-scraping beautifulsoup
更新时间 : 2023-09-21
英文 : How to extract the href and a tag within the span tag which don't have a class

from urllib.request import urlopen
from bs4 import BeautifulSoup as soup
import pandas as pd
amazon_url = "https://www.amazon.in/s?k=earbuds"
amazon_data = urlopen(amazon_url)
print (type(amazon_url)) 
amazon_html = amazon_data.read()
#amazon_html
amazon_soup = soup(amazon_html,'html.parser')
page= amazon_soup.findAll('span',{'class':'s-pagination-item s-pagination-disabled'})['a']

有很多方法可以访问元素。

<span id="logo-ext" />

例如每个id：

CSS选择器->span[id="logo-ext"]
XPATH->//span[@id='logo-ext']

如果绝对没有属性可识别，则可以按路线进行识别。

例如。CSS选择器->div[class="div-including-element"] > span

你需要Wich元素吗？

最新更新

Scss函数没有返回计算值
如何使用conduit获取一个lazy ByteString并将其写入文件(在恒定内存中)
c -内存分配器-简单隔离存储:你如何从它的地址推断分配块的大小?
获取JSON格式的Discord PY对象
如何为作为prop传入的React组件设置类型
在c++中使用new时是否按顺序分配内存?
你可以暂时复制谷歌云图像文件在Python?
PHP cURL 一个帖子但两次(双)它是相同的数据到数据库与 API
405 (Method Not Allowed)错误的ajax在Laravel 8
Sicstus:一个模块和CWD
Laravel在模型中有onethrough关系
Whiptail:当一个仪表正在运行时，我该如何处理一个错误?
关于Sacha Willems的示例代码的Vulkan屏幕外渲染问题
有人可以分解nums[i] = nums[i-1] + nums[i]做什么?(Python) &g
如何在 Qwidget 上绘制二维码，我在 Windows 10 上使用 Qt Creator C++
Fluentd td-agent.log文件大小持续增加
暂停javascript for循环，同时等待从突变观察者的响应?
Jetpack撰写更新广告横幅在Android视图
在ASP中构建级联下拉列表的问题. NET Core 7 MVC使用JQuery和ajax.googleapis.com
在EAS中找不到"expo dev client"错误所依赖的"expo devel la
需要帮助在文件之间本地共享Javascript变量
在Azure中删除自定义域失败
如何用谷歌电子表格正确阅读的R编写CSV
c -为什么在串行控制台的其他接口上使用UART ?
按字符串过滤数组
如何在响应式表单的ng-select中设置默认值
我希望条件只迭代映射函数，而不是渲染部分
如何在'配置'对象中的'过滤器'对象在Vis.js工作?
如何解决问题与类型在NextJs (Typescript)?
订单(记录)应该始终按照创建的顺序完成

如何在没有类的 span 标签中提取 href 和标签

相关内容

最新更新

热门标签：