又一个小玩意

文中描述的服务已经停止。

上次爬的海盗湾的数据，还有百度知道的数据，因为没有设计好数据表的结构，觉得没什么用，重装系统的时候没有备份了。系统装好之后迁移数据时，发现留下来一个小东西，是从别人的小爬虫改的，用来抓取链到某一个页面上的所有链接地址。看着好像挺有用的，就顺手改了一下。

现在可以接受两个参数，url 和format 。url 指明要抓取的目标网址，需要带http:// 前缀；format 指明返回结果的格式，有xml 和json 两种。要注意的是json 格式可能返回的是json 字符串，需要eval 一下才能作为json 对象使用。Update：小修改了一下，现在只返回json格式数据，只需要传入url参数即可。点击这个链接可以查看返回的数据结构示例：http://mynook.info/try/spider/linker.php?url=http://mynook.info

地址在：http://mynook.info/try/spider/linker.php （直接访问会返回一个参数错误）。

又一个小玩意

分类

友情链接

其它