介绍采集电话号码的方法
建立采集任务
- 01将要采集的58网站地址复制下来(这里只是举的一个网站例子,其他网页的采集,可以参考这个教程的步骤去进行采集规则的编辑)
- 02登录采集器
- 03选择采集模式中的高级模式,点击开始采集
- 04编辑采集任务名称,完成后点击“下一步”
- 01将复制的网页地址粘贴在八爪鱼采集器内置浏览器的地址栏中,点击跳转,采集的网页会在下方浏览器中打开,流程设计器中会生成一个“打开网页”步骤
- 02将网页下拉到底部,找到翻页的按钮,右键点击,选择执行“循环点击这个元素”
- 03完成后流程设计器会生成一个翻页循环,点击“自定义”进行设置
- 04选择“元素文本=下一页”这个选项,点击确定,完成翻页循环的创建
- 05完成上述操作后,找到页面中第一个房源信息的方框,右键点击,在跳出的操作框中,选择下图红色方框的选项“创建一个元素列表”
- 06将第一个房源的信息”添加到列表“中,点击“继续编辑列表”
- 07点击第二个方框中的房源信息,同样将其”添加到列表“中
- 08八爪鱼会将具有相似特征的元素抓取到列表中,如下图,所有的信息都被添加到列表,接着点击“创建列表完成“,
- 09再点击“循环”,完成列表的创建
- 10创建列表完成后流程图,如左侧所示,接着我们需要对采集电话号码进行抓取,因为这个网页的电话号码都是图片的格式,所以我们需要将改网页切换成极速版的,再对需要的电话号码进行采集,将网页下拉到底部,找到“极速版”的按钮右键点击,选择执行“点击这个元素”
- 11如图右键点击房源信息中的电话号码,在跳出的执行框中,选择执行“抓取这个元素文本”,页面中其他数据的信息抓取,重复同样的步骤即可
- 12抓取到的内容会显示在右上方的操作框中,这里可以修改采集字段的名称,到这里我们就完成了电话号码在网页中的抓取
- 13【58电话号码采集方法】由于每一页都需要循环采集数据,所以我们需要将这个循环列表拖入到翻页循环里面 。
- 14注意:流程是从上网页执行的,所以这个循环列表需要放到点击翻页的前面,否则会漏掉第一页的数据 。最终流程图如下图所示:点击保存,进入下一个采集步骤
推荐阅读
- 怎样护肤方法
- 国外网站加速
- 免费注册域名
- 豌豆苗的种植方法是什么
- 铁棍山药的种植方法有哪些
- 耳机如何煲机 耳机煲机方法
- 婴儿感冒发烧退烧物理方法 婴儿感冒发烧的护理措施
- 冷水观赏鱼养殖方法和注意事项
- 养虎猫的正确方法
- 让狗狗开心的最佳方法