全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 1045|回复: 9
打印 上一主题 下一主题

[Windows VPS] 一个火车头采集的规则指点下..谢谢

[复制链接]
跳转到指定楼层
1#
发表于 2014-9-26 09:59:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 jqw1992 于 2014-9-26 10:01 编辑

我采集了下来以后成这样:


  1.         {"is_filter": true, "id": "fashion", "name": "Fashion"}, {"is_filter": false, "id": "womensfashion", "name": "Women's Fashion"}, {"is_filter": true, "id": "women", "name": "Women"}, {"is_filter": false, "id": "dres", "name": "Dress"}, {"is_filter": false, "id": "sexy", "name": "sexy"}, {"is_filter": false, "id": "sexydres", "name": "Sexy Dress"}, {"is_filter": false, "id": "skirt", "name": "Skirts"}, {"is_filter": false, "id": "partydres", "name": "Party Dress"}, {"is_filter": false, "id": "printed", "name": "printed"}, {"is_filter": false, "id": "slimfit", "name": "Slim Fit"}, {"is_filter": false, "id": "trend", "name": "Trend"}, {"is_filter": false, "id": "sexyskirt", "name": "sexy skirt"}, {"is_filter": false, "id": "longdres", "name": "long dress"}, {"is_filter": false, "id": "nightclubsskirt", "name": "Nightclubs Skirt"}, {"is_filter": false, "id": "topsale", "name": "top sales"}, {"is_filter": false, "id": "womensiameseskirt", "name": "Women Siamese Skirt"}

复制代码

然后我想用正则还是什么把它变成
Fashion,Women's Fashion,....【就是对于“name”后面的 东西提取出来。】这个不知道怎么写,谢谢指导一下;我觉得应该是正则写的,但是写不来,昨天折腾到2点多还没有出来。。。
推荐
发表于 2014-9-26 11:12:58 | 只看该作者
jqw1992 发表于 2014-9-26 11:07
替换的话 "id": "fashion"这个数据是不可预知的

自己寻找规律了
"id": "fashion"
连在一起的话就
"id": "*"
2#
发表于 2014-9-26 10:05:50 | 只看该作者
本帖最后由 ninqq 于 2014-9-26 10:07 编辑

测试了下 貌似不能火车头不支持对采集下来的数据进行 循环提取
测试只能提取第一条NAME数据 后面的不行

建议写成插件或者使用php处理吧 虽然我不懂

补充,刚给你想到了一个办法 既然不能提取,那么把其他你不需要的数据进行删除还是可以的
3#
 楼主| 发表于 2014-9-26 10:18:51 | 只看该作者
ninqq 发表于 2014-9-26 10:05
测试了下 貌似不能火车头不支持对采集下来的数据进行 循环提取
测试只能提取第一条NAME数据 后面的不行

谢谢呀,其他数据 删除,怎么删除??麻烦指导下
4#
发表于 2014-9-26 10:45:27 来自手机 | 只看该作者
循环匹配,怎么不可以?只不过很麻烦。用插件就方便很多
5#
 楼主| 发表于 2014-9-26 10:54:42 | 只看该作者
wmfy808 发表于 2014-9-26 10:45
循环匹配,怎么不可以?只不过很麻烦。用插件就方便很多

插件,是什么插件?
6#
发表于 2014-9-26 11:00:54 | 只看该作者
jqw1992 发表于 2014-9-26 10:18
谢谢呀,其他数据 删除,怎么删除??麻烦指导下

使用替换功能 替换为空
7#
发表于 2014-9-26 11:07:16 | 只看该作者
wmfy808 发表于 2014-9-26 10:45
循环匹配,怎么不可以?只不过很麻烦。用插件就方便很多

采集的时候可以循环 采集下来的字段进行再次处理是不能的
8#
 楼主| 发表于 2014-9-26 11:07:19 | 只看该作者
ninqq 发表于 2014-9-26 11:00
使用替换功能 替换为空

替换的话 "id": "fashion"这个数据是不可预知的
10#
 楼主| 发表于 2014-9-26 11:46:43 | 只看该作者
ninqq 发表于 2014-9-26 11:12
自己寻找规律了
"id": "fashion"
连在一起的话就

谢谢,搞定了。之前用这个没有实现,以为不行,然后刚才看你这个又试了下,谢谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-10-31 06:40 , Processed in 0.069046 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表