,,使用phantomjs进行网页抓取的实现代码

,,使用phantomjs进行网页抓取的实现代码

本文主要介绍使用phantomjs进行网页抓取的实现代码,有需要的朋友可以参考一下。

Phantomjs可以运行js,因为它是一个无头浏览器,所以它也可以运行dom节点,这是抓取网页的最佳方式。

比如我们要批量抓取“历史上的今天”的内容。网站

根据对dom结构的观察,我们只需要得到。列出li a .所以我们使用高级选择器来构建dom片段。

变量d=' '

var c=document.querySelectorAll('。列出阿利’)

var l=c.length

for(var I=0;il;i ){

d=d c[i]。标题' \n '

}

之后就让js代码在phantomjs里运行吧~

var page=require('网页')。create();

page . Open(' 3358 www.todayonhistory.com/',function(状态){//打开页面

如果(状态!=='成功'){

console.log('无法加载地址');

}否则{

console . log(page . evaluate(function(){

变量d=' '

var c=document.querySelectorAll('。列出阿利’)

var l=c.length

for(var I=0;il;i ){

d=d c[i]。标题' \n '

}

返回d

}))

}

幻影. exit();

});

最后我们保存为catch.js,在dos下执行,将内容输出到一个txt文件(也可以用phantomjs的file api编写)。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

相关文章阅读

  • 关于js中的全等和不全等,等于和不等于问题的关系,,关于JS中的全等和不全等、等于和不等于问题
  • Vue项目启动,nodejs启动vue项目,如何启动一个Vue.js项目
  • vue双向绑定和单向绑定,vue.js 双向绑定,Vue双向绑定详解
  • vue事件修饰符和按键修饰符,vue事件绑定修饰符都有哪些,Vue.js 事件修饰符的使用教程
  • vue中-model的作用,Vue中的v-model指令的作用是-,vue.js 实现v-model与{{}}指令方法
  • vue2.0双向绑定原理,vue.js 双向绑定
  • vue2.0双向绑定原理,vue.js 双向绑定,深入理解vue.js双向绑定的实现原理
  • vue.js路由跳转,vue-router路由跳转,Vue路由跳转的4种方式小结
  • vue.js打包,vue前端如何打包,详解Vue项目的打包方式
  • vue.js前后端分离,vue前后端分离web项目,Vue之前端体系与前后端分离详解
  • vue.js 遍历数组,vue中遍历数组中的一个对象中的值
  • vue.js 遍历数组,vue中遍历数组中的一个对象中的值,Vue中遍历数组的新方法实例详解
  • UglifyJsPlugin,,Uglifyjs(JS代码优化工具)入门 安装使用
  • seajs教程,seajs还有人用吗,Sea.JS知识总结
  • require的用法js,require.js
  • 留言与评论(共有 条评论)
       
    验证码: