python初学者入门,零基础学Python
1如何创建目录?Os.mkdir(目录名)
2.urllib.request.Request (web链接)
Urllib.request.Request对象的编写方式使得网站更容易被视为用户访问。
如何获取请求对象?字符串类型网站的强制类型转换,即请求(“网站地址”)
3.网站如何检查访问对象是否为用户?检查用户代理
4如何查看网站的用户代理?
右键点击网页,点击检查,然后查看网络。这个时候,看底部.看看是否有什么在运行。如果没有小网页,那就让网页改变。这时,有东西在跑。点击这个东西,用户代理就会出现。
5.stra.find(strb,[开始索引],[结束索引])在stra中查找strb并返回索引。
6.图片是二进制代码的形式
网页是utf-8格式的。
7.stra.split (separator)通过指定的分隔符分割字符串,并返回分割后的字符串列表。
8.list1[-1]获取列表的最后一个元素
9.if _ _ name _ _= _ _ main _ _ 的作用:
使用if __name__==__main__ 来确定。py文件直接运行。
源代码如下
导入urllib。请求导入OS def URL _ open(URL):req=URL lib . request . request(URL)#生成请求对象。为什么会产生这个对象?#因为你要给它添加一个文件头,让它看起来更像是用户访问req.add _ header (user-agent , Mozilla/5.0(Linux;安卓6.0;nexus 5 Build/xy DCT)apple WebKit/537.36(KHTML,像壁虎一样)Chrome/60 . 0 . 3112 . 90 Mobile Safari/537.36 )response=urllib . request . URL open(URL)html=response . read()# html的类型是字符串return html def get _ page(URL):html=URL _ open(URL)。decode (UTF-8) a=html.find(当前-评论-页面)23b=html.find (],A)return html[A:b]# return string def find _ imgs(URL):#查找链接中的图片html=URL _ open (URL)。decode (utf-8) img _ addrs=[] #所有图片保存的地址a=html.find(img src=) #找不到。=-1: b=html.find(。jpg ,a,a255) #最长链接如果b只有255!=-1:img _ addrs . append( http: html[a 9:b 4])else:b=a 9 a=html . find( img src=,b)return img _ addrs def save _ imgs(folder,img _ addrs):for each in img _ addrs:filename=each . split(/)[-1]with open(filename, WB )as f:img=URL _ open(each)f . write(img)def download(folder= ooxx pages=10):OS . mkdir(folder)OS . chdir(folder)#将当前目录切换到此目录URL= 3358jandan.net/ooxx page _ num=int(get _ page(URL))for I in range(pages):page _ num=page _ num-I page _ URL=URL /page- str(page _ num) # comments img _ addrs=find _ imgs(page _ URL)#此列表保存此页码找到的所有图片Save _ imgs (folder,img _ addrs) if _ _ name .
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。