欢迎光临
我们一直在努力

【火车头采集教程】轻而易举学会火车头采集(附带采集案例)

咔咔不会用python,也没打算为了爬点东西就去学python。时间成本不允许我这样做
于是咔咔使用了一款工具,火车头采集工具
这款工具学会了很简单,不会的全是问题
下来咔咔会把这个工具的从开始到结束的实现流程写出来

此篇文章用时俩天完成,咔咔也是从一个小白摸索过来的,网上的文章我是看的一头雾水,就写了一篇,希望可以帮助到大家

基础准备
1.下载火车头采集工具
火车头工具有可能需要登录,自己看

2.认识火车头
web发布配置:是使用接口进行发布
web发布模块:是使用接口发布的参数,相当于是一个发布模板而已
数据库发布配置和数据库发布模块也是同理
但是经常使用的就是web发布的这俩个模块,数据库的自己试试就可以了

在这里插入图片描述

2-1.新建采集任务

在这里插入图片描述

2-2.设置网址采集规则

起始网址就是需要采集的地址

在这里插入图片描述

采集案例

1.配置采集规则

先用电影类型这个链接

在这里插入图片描述

然后查看网址规则,我们会发现这个就是我们需要的采集地址

在这里插入图片描述

然后将采集网址和采集规则写到配置里边

<a target="_blank" href="[参数]" class="subject_link(*)">
在这里插入图片描述

点击网址测试采集,然后这些网址就是我们需要采集的内容页网址

在这里插入图片描述

2.获取图片

可以看到他的图片代码是这个样子的

在这里插入图片描述

开始写规则

<div id="(*)" class="message"><p><img src="[参数]"
在这里插入图片描述

3.获取原名

这一块可以看到的是他的标签都是一样的,那么设置的采集规则也就是一致的

在这里插入图片描述

1 2
赞(0) 打赏
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 ivillcn@qq.com 举报,一经查实,本站将立刻删除。
文章名称:《【火车头采集教程】轻而易举学会火车头采集(附带采集案例)》
文章链接:https://www.bilibiji.com/article/104.html

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫

登录

找回密码

注册