小贝子编程

从我的网络搜索(搜索引擎)检索和解析数据

本文关键字：检索和解数据搜索引擎网络搜索 c# .net webclient
更新时间 : 2023-09-16
英文 : Retrieving and parsing data from mywebsearch (search engine)

我一直在尝试制作一个工具，允许我输入关键字并让它自动执行此操作：

int.search.mywebsearch.com/mywebsearch/GGweb.jhtml?searchfor=Keyword

然后，抓取页面上的所有 URL。

但是，当我转到 regexxr 或 regex101 时，似乎网址不存在，我无法使用正则表达式来获取它。如何抓取无法使用WebClient.downloadstring(url)下载的内容？

法典：

WebClient wc = new WebClient();
foreach(string s in Keywords)
{
string url = wc.DownloadString("https://int.search.mywebsearch.com/mywebsearch/GGmain.jhtml?&searchfor=" + s);
MatchCollection mc = Regex.Matches(url, @""); // Didn't write any regex yet
}

使用此正则表达式：

<a[^>]+hrefs?=s?"([^"]+)"[^>]?>

工作演示

最新更新

无法获取熊猫数据帧中的第一列值
Odoo添加按钮应该重定向到我的模块视图
r语言 - 我如何得到比例在数据表没有组号重复?
无法使用 conda env 导入 OCI 笔记本会话中的模型配置详细信息
c - while循环中VSC的分段错误
无法将url数据获取到模型类中
如何将DataGridTextColumn绑定到WinUI3中绑定的对象中的方法?
错误在cobol程序上打开VB文件来处理XML文件
while循环在python中没有爆发
yii2查询具有多个非和或的数据提供程序
Libgdx:渲染方法
Pycharm 错误：预期类型 [类名] 改为"str"
运行我的代码时出现错误:未知的自定义元素
在Selenium 4中使用Behat和Mink Selenium2驱动程序为Microsoft Edge浏览器运行测试
宽度未知的可变列数
我必须在.env文件中存储哨兵公钥吗?
Mongodb子文档没有自动生成对象id Typegoose/ mongoose
类型中构造函数的参数 0 需要找不到类型为"org.hibernate.SessionFactory"的 Bean
根据r中的日期和小时每隔15分钟聚合数据
如何解决关于Optuna存储的错误?
c语言中OO继承的混叠问题
launchWebAuthFlow窗口在chrome扩展关闭后保持打开
使用非初始结构变量作为参数调用函数不会产生警告
Pytorch - mat1和mat2形状不能相乘(3328x13和9216x4096)
我如何得到一个节点超时的内部id使用符号没有硬编码查找索引?
spring引导应用程序读取另一个jar的应用程序配置值吗?
如何在main.js中导入javascript库以在整个vue应用程序中获得全局可用性?
使段落出现，并使其在点击显示下一个段落时消失
GROUP_CONCAT(DISTINCT xxx)将连接值的顺序颠倒
r语言 - 循环遍历列表的列表

从我的网络搜索(搜索引擎)检索和解析数据

相关内容

最新更新

热门标签：