全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 505|回复: 0
打印 上一主题 下一主题

火车头,怎么能让他不自己获取内容页面地址?

[复制链接]
跳转到指定楼层
1#
发表于 2012-12-20 09:56:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 joyanhui 于 2012-12-20 10:08 编辑


对方网站内容地址  http://www.123.com/show.asp?id=1    一直到 http://www.123.com/show.asp?id=500000

所以我直接无视他的列表页,直接从内容获取分类,然后打算花直接从id=1 跑到id=50W。

我在火车头里面 添加了采集网址规则 从1-500000  步进是1
  1. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3024
  2. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3025
  3. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3026
  4. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3027
  5. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3028
  6. 成功采集网址并保存到数据库中:http://www.123.com/show.asp?id=3029
复制代码
但是 它竟然4-5秒才保存一次,而且一次只添加20个左右。到现在才添加了3000多个。。。。

虽然vps上挂机跑的,不费电,但是浪费时间。。。。求加速!!我不想到世界末日还没有添加完网址。

======================================================
刚刚发完帖子想起来,50万个地址 分成了10分,一份5万,一边采集 一边生成内容页地址,慢慢跑吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-27 20:32 , Processed in 0.061117 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表