互联网的搬运工 分类搜索 官网    VIP电影   留言板   免责声明    我要投稿   后花园

网站首页 经验 正文

火车头采集器常见问题及解决方案

小冰 2020-03-09 经验 40 ℃ 0 评论

1.下载的那些模块怎么导入到火车里面?
答:将下载的模块放入火车Module文件夹中即可到.

2.web在线发布错误 注意查看返回源代码(只显示一次,以下雷同): ,怎么回事?
答:按提示,查看返回源代码,就是点击那出错那一行,查看返回的信息。看一下返回的什么信息,是没登陆还是其它什么问题。

3.问一下,可以对内容或标题有多种规则吗?也就是采有多套风格的网站
答:这个你可以使用正则来编写规则。

4.发布后出现[标签:内容]或其他的标签如[标签:下载]?
答:第一,你的内容规则里没有“内容”这个标签,或者你把内容给改成别的名称了,而登录模块里有内容这个标签。第二,规则有问题或采集时没有采集到内容,也就是说你本的采的内容是空的。
5.发布的时候,字符中间没有空格了,如<CENTER><TD WIDTH="160" ALIGN="CENTER"><B>发布时会变成<CENTER><TDWIDTH="160"ALIGN="CENTER"><B>。如何解决了?
答:任务设置里 选中urlencode

6.采集后发贴,自动发贴可以控制发贴间隔时间的吗?
答:3.2SP3版本前在系统全局设置.3.2SP3版本之后在任务里的文件保存及任务设置里.

7.我的贴子发到论坛上发现没换行,全都挤在了一起,怎么办?
答:第一 任务设置里 选中urlencode,第二,将
替换成
.

8.发内容–WEB发布是否成功未知,请到网站查看:文章标题. 这是怎么回事?
答:一般是发的太快了,服务器未有返回字符.请把发布时间改长些.

9.如何把因为网速的原因采集来的空文章的地址单独提取出来重新采集.?
答:update content set [已采]=false where [内容]="" (在标准版里执行该命令,免费版中自己写个小程序或打开数据库处理一下就可以了),这样是将内容为空的设置为未采,你可以再重新再采一次。

10.怎样拼接采到的内容,比如我想把内容和下载两个标签弄成内容发出去..
答:修改模块,把发布post里边的[标签:内容]换成[标签:内容][标签:下载],可以多个标签这样合并.

11.文章采集回来是乱码, 是啥原因?
答:请查看目标站和你自己站的编码,并在规则和发布的相应位置填写正确.

12.为啥我设置了关键字但网页显示关键字:[标签:SY_关键字] ?

答:这个SY_标签是收费版本中提取处理采集内容的字段,请确认你的程序为收费版本 。

13.发出来的每个都是2条?

答:可能是论坛的网址,因为论坛是有tid=1 tid=1&page=2的情况,你没有过滤第二个网址,导致重复。

14. 出现 该地址重复采集 提示 ?

答:这是你先前采集过该网址了,火车头在采集时会将采集到的网址在站点数据库和任务数据库里各存一份,所以要对已采过的重新采集,就要在键选择 删除该任务采集地址库,那样就不会再提示你重复了。

15.采集的字数过多,无法发布成功?

答:有些文章系统和论坛对标题长度有限制,如果你采的标题很长,那么就会出现字数过多而不能发布的问题。这时,你可以这样做,一是写规则时排除那些冗长的文字,第二是你对采集到的数据进入数据库截取一定长度的字数,第三,使用正则表达式

16.采集器.是先排除,还是先替换?

答:先排除再替换

17.PHPWIND发布的时候提示非法请求!

答:你看模块说明,要用软件模拟登陆,请看下你是否按这操作了。不然是不会成功的。

18.WEB发布错误&WEB发布是否成功未知 ,什么问题?

答:出现这个是因为采集器在发布后没有找到返回的成功标识码。有以下几个可能,一是发布成功了,但模块里的成功标识码不对,所以不成功,二是成功了或失败了,但发表的太快,没有返回任何信息。三是发布失败,模块里没有相应的失败信息。

19.请教如何删除换行符?

答:添加过滤,在内容那里按一下回车,然后确定!

20.如何既支持<title>又支持<TITLE>?也就是同时支持大小写

又支持<title>?也就是同时支持大小写答:全局设置里 设置忽略大小写21.采集并发布到网站后,标题前多出个被采集站的网址,如何解决?答:这个注意,规则里不要选探测真实地址的选项。19.请教如何删除换行符?

答:全局设置里 设置忽略大小写

21.采集并发布到网站后,标题前多出个被采集站的网址,如何解决?

答:这个注意,规则里不要选探测真实地址的选项。

Tags:

< 温馨提示 >
本站资源如有密码均为:70ol.com
学到东西应该懂得感恩作者 无脑喷子永封IP段+删帐号所有评论
本站资源软件和源码 文章大部分为网上收集,如侵犯您的权利,请告知管理员,我们会及时删除,并向您赔礼道歉.

站长QQ:  官方QQ群:558413792

猜你喜欢

本文暂时没有评论,来添加一个吧(●'◡'●)


欢迎 发表评论:

请填写验证码
搜索
最近发表
网站分类
友情链接
标签列表
文章归档
最新留言
站点信息
  • 文章总数:242
  • 页面总数:1
  • 分类总数:14
  • 标签总数:16
  • 评论总数:1
  • 浏览总数:161885