# 爬虫20161008 **Repository Path**: starry123/Spider00 ## Basic Information - **Project Name**: 爬虫20161008 - **Description**: 2016年10月8日做的c#爬虫可视化界面 - **Primary Language**: C# - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 8 - **Created**: 2020-06-06 - **Last Updated**: 2025-04-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 爬虫20161008 #### 介绍 2016年10月8日做的c#爬虫可视化界面 #### 软件架构 软件架构说明 点击 添加搜索资源 按钮可以出现这个界面 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224037_6fb388ec_958369.jpeg "1.jpg") 按照如下实例填写窗体 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224048_ba74df19_958369.png "2.png") 由于这个窗体是获取列表地址 所以在测试显示时务必出现 例如下面的内容 及正确的文章列表的地址列表 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224100_e392ef74_958369.png "3.png") 在入口地址正确且地址列表正确的情况下 进入第二个步骤 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224117_ff0fb4e6_958369.png "4.png") 填写正确的正则表达式 直至出现正确的标题,时间,内容 例如: ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224129_baa5194f_958369.png "5.png") 测试显示标题:例 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224147_540a5e14_958369.png "6.png") 测试显示时间:例 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224205_a3795374_958369.png "7.png") 测试显示内容:例 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224216_a17dbbe7_958369.png "8.png") 当上面这些内容都无误以后点击保存按钮 回到主界面 点击 刷新列表 按钮刷新新闻列表 我们也可以修改已经在爬虫列表中的网站 选中需要编辑的网站 点击 编辑选中按钮 进行编辑 操作方式同添加 为了作业按照我们的需求执行 我们也可以 定制作业来执行爬虫 点击定制作业 按钮 出现如下界面 按需求执行爬虫 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0606/224232_a8fc2146_958369.png "9.png") 在制定完作业后点击 按作业执行爬虫 按钮运行 爬虫程序 注:在校验执行正则表达式的时候由于界面不太直观,我们可以点击主界面上的 正则 按钮 去网站上去校验执行正则表达式