python参考资料,python博客网站
源代码介绍:
适用范围:百度云网盘搜索引擎源代码,百度搜索引擎源代码,网盘搜索爬虫源代码
演讲地址:(以截图为准)
运行环境:PHP,MYSQL
注:分享的源代码是一个搜索引擎,百度云盘爬虫源代码,Python百度云盘搜索引擎,爬虫网站,搜索引擎使用Xunsearch进行高效搜索。源码很简单,有安装教程,可以打开两次。在这里,我爱免费分享,全自动更新百度云盘内容,全自动收藏!
#爱百赢-百度云搜索引擎,安装部署教程
# #运行环境
开始之前,您需要安装
* PHP 5.3.7
* MySQL
* Python 2.7 ~
*[Xun search](http://xunsearch.com/)搜索引擎
# #获取源代码
```
git克隆git @ github . com:k 1995/Baidu yun spider . git
```
或者手动下载。
```
https://github.com/k1995/BaiduyunSpider/archive/master.zip
```
下载后,项目目录结构大致如下
```
-索引器/#索引
-蜘蛛/#爬虫
- sql/
- web/#网站
-应用/
- config/#与配置相关
config.php
-database.php #数据库配置
.
.
- static/# store静态资源,cssjsfont
-系统/
index.php
.
```
# #开始部署
# # #创建数据库
创建一个名为“pan”的数据库,编码设置为“UTF-8”。然后导入“SQL”来完成表的创建。
# # #网站部署
支持nginx,apache服务器。
__apache__需要打开*mod_rewrite*。
__nginx__的配置如下
```
位置/
{
索引index.php;
try _ files $ uri $ uri//index . PHP/$ uri;
}
地点~【^/]\.php(/$)
{
fastcgi _ pass 127 . 0 . 0 . 1:9000;
fastcgi _ index index.php;
包括fastcgi.conf
包含pathinfo.conf
}
```
# # # #配置文件修改
` config.php 文件修改网站标题、描述等信息。
Database.php 修改数据库账号,密码等信息。
网站是基于CodeIgniter框架开发的。如果安装、部署或二次开发有问题,请参考【官网文档】(http://codeigniter.org.cn/user_guide/general/welcome.html)
# # #启动爬虫
进入“spider/”目录,修改spider.py中的数据库信息。
_ _如果您是第一次部署,您需要运行以下命令来完成种子设定_ _
```
python spider.py - seed-user
```
其实以上就是抓取百度云热门分享用户的相关信息,然后开始从他们那里抓取数据。
那就跑。
```
python spider.py
```
这时,爬虫已经开始工作了。
# # #安装xunsearch
目前使用__xunsearch__作为搜索引擎,稍后将替换为elasticsearch。
请参考安装流程(不需要安装,PHP SDK,我已经集成到web里了)
http://xunsearch.com/doc/php/guide/start.installation
# # #索引数据
以上,我们已经完成了爬虫的数据抓取和网站建设,但是还不能搜索。让我们开始最后一步,指数的建立。
转到“indexer/”目录,在“indexer.php”中将$前缀替换为您的网站的根路径
```
需要 $ prefix/application/helpers/xs/lib/xs . PHP ;
```
并修改数据库帐户密码。
那就跑。
```
python。/index.php
```
到目前为止,所有的程序都已安装完毕。如有疑问,欢迎发帖至【github中文社区】(http://www.githubs.cn/topic/118)。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。