初学者帮助 - 抓取电子商务网站



我是爬虫和网络爬行的新手。我正在尝试从印度的电子商务网站抓取数据,但无法这样做。

我正在尝试从以下超链接中提取文本:

<a ng-href="/pd/40011505/figaro-extra-virgin-olive-oil-1-ltr/?nc=cl-prod-list&amp;t_pg=&amp;t_p=&amp;t_s=cl-prod-list&amp;t_pos=1&amp;t_ch=desktop" ng-click="vm.pushToGoogleAnalytics('_trackEvent','item-clicked','custom-page',sectionModel.display_pos+' | '+sectionModel.pageinternalName+' | LNPD | '+sectionModel.internalName+' | '+vm.selectedProduct.sku+' | '+vm.selectedProduct.p_desc +' | '+ vm.itemposition,1)" class="ng-binding" style="text-align: left;" data-original-title="" data-trigger="focus" uib-tooltip="Extra Virgin Olive Oil" data-sectioninteractionplower="{&quot;EventName&quot;:&quot;ItemClicked&quot;, &quot;CustomPageGroup&quot; : &quot;&quot;, &quot;CustomPage&quot;:&quot;&quot;, &quot;ScreenInPageContext&quot; : &quot;cl-prod-list&quot;, &quot;ScreenInPagePosition&quot;:&quot;1&quot;,
&quot;SectionItemName&quot;:&quot;&quot;, &quot;SectionItemPosition&quot;:&quot;1&quot;}" ng-bind="vm.selectedProduct.p_desc" href="/pd/40011505/figaro-extra-virgin-olive-oil-1-ltr/?nc=cl-prod-list&amp;t_pg=&amp;t_p=&amp;t_s=cl-prod-list&amp;t_pos=1&amp;t_ch=desktop" css="1">Extra Virgin Olive Oil</a>

Xpath/CSS 选择器对我不起作用。

感谢任何帮助。

要从 a 标签中获取文本,我将使用以下 css 选择器

resp.css('a::text').extract()

响应:

['Extra Virgin Olive Oil']

最新更新