又一个小玩意
文中描述的服务已经停止。
上次爬的海盗湾的数据,还有百度知道的数据,因为没有设计好数据表的结构,觉得没什么用,重装系统的时候没有备份了。系统装好之后迁移数据时,发现留下来一个小东西,是从别人的小爬虫改的,用来抓取链到某一个页面上的所有链接地址。看着好像挺有用的,就顺手改了一下。
现在可以接受两个参数,url 和format 。url 指明要抓取的目标网址,需要带http:// 前缀;format 指明返回结果的格式,有xml 和json 两种。要注意的是json 格式可能返回的是json 字符串,需要eval 一下才能作为json 对象使用。Update:小修改了一下,现在只返回json格式数据,只需要传入url参数即可。点击这个链接可以查看返回的数据结构示例:http://mynook.info/try/spider/linker.php?url=http://mynook.info
地址在:http://mynook.info/try/spider/linker.php (直接访问会返回一个参数错误)。