用selenium爬取百度文库,python selenium菜鸟教程
Selenium是一个开源的测试框架,可以直接在浏览器中运行,就像用户可以直接操作浏览器一样,非常方便。它支持主流浏览器:chrome、Firefox、IE等。同时可以使用Java、python、Javascript、c#等主流编程语言。在这里,笔者只介绍selenium在Java chrome环境下的爬虫应用。本文介绍了selenium的下载和入口应用。
一、下载1。chrome浏览器:如果没有,可以百度下载。2.eclipse2019:百度下载安装。按照提示进行下一步。3.可以下载硒的jar包:1百度搜索:硒,或者直接输入网址:https://selenium.dev/downloads/2。下载后,您将获得最新版本的selenium的jar包。client-combined是selenium的核心包,它的扩展包位于libs文件夹下。之后,这些jar包需要被引入到新项目中。
4.下载Chrome Driver . exe:Chrome驱动官方下载
1chromeDriver.exe Chrome浏览器驱动,用它selenium可以控制浏览器操作。与chromeDriver.exe chrome的版本有对应关系。如果Chrome浏览器与不同版本的ChromeDriver.exe配对,就无法启动浏览器。版本对应表如下:
2查看你电脑的chrome浏览器版本,发现我的是78.0.3904.11。打开ChromeDriver.exe的下载地址,下载相应版本的程序。
2.创建新的selenium项目1。打开eclipse并创建一个新的Java项目:SeleniumDemo。
2.将刚刚下载的jar包导入到项目中。
3.创建一个新类selenium01。在main方法中输入以下三句话,完成Selenium最简单的程序:1。设置浏览器驱动路径:system . set property(" web driver . chrome . driver "," C:\ program files(x86)\ Google \ chrome \ application \ chrome driver . exe ")。
2.创建一个chrome浏览器对象:web driver web driver=new chrome driver();
3.命令浏览器访问百度web driver . get(" http://www . Baidu . com ");
4.一切都完了。来看看效果吧。点击之后,电脑会弹出一个chrome浏览器,自动进入:http://www.baidu.com。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。