python初学者入门,零基础学Python

　　1如何创建目录？Os.mkdir(目录名)

　　2.urllib.request.Request (web链接)

　　Urllib.request.Request对象的编写方式使得网站更容易被视为用户访问。

　　如何获取请求对象？字符串类型网站的强制类型转换，即请求(“网站地址”)

　　3.网站如何检查访问对象是否为用户？检查用户代理

　　4如何查看网站的用户代理？

　　右键点击网页，点击检查，然后查看网络。这个时候，看底部.看看是否有什么在运行。如果没有小网页，那就让网页改变。这时，有东西在跑。点击这个东西，用户代理就会出现。

　　5.stra.find(strb，[开始索引]，[结束索引])在stra中查找strb并返回索引。

　　6.图片是二进制代码的形式

　　网页是utf-8格式的。

　　7.stra.split (separator)通过指定的分隔符分割字符串，并返回分割后的字符串列表。

　　8.list1[-1]获取列表的最后一个元素

　　9.if _ _ name _ _= _ _ main _ _ 的作用：

　　使用if __name__==__main__ 来确定。py文件直接运行。

　　源代码如下

　　导入urllib。请求导入OS def URL _ open(URL):req=URL lib . request . request(URL)#生成请求对象。为什么会产生这个对象？#因为你要给它添加一个文件头，让它看起来更像是用户访问req.add _ header (user-agent ， Mozilla/5.0(Linux；安卓6.0；nexus 5 Build/xy DCT)apple WebKit/537.36(KHTML，像壁虎一样)Chrome/60 . 0 . 3112 . 90 Mobile Safari/537.36 )response=urllib . request . URL open(URL)html=response . read()# html的类型是字符串return html def get _ page(URL):html=URL _ open(URL)。decode (UTF-8) a=html.find(当前-评论-页面)23b=html.find (]，A)return html[A:b]# return string def find _ imgs(URL):#查找链接中的图片html=URL _ open (URL)。decode (utf-8) img _ addrs=[] #所有图片保存的地址a=html.find(img src=) #找不到。=-1: b=html.find(。jpg ，a，a255) #最长链接如果b只有255！=-1:img _ addrs . append( http: html[a 9:b 4])else:b=a 9 a=html . find( img src=，b)return img _ addrs def save _ imgs(folder，img _ addrs):for each in img _ addrs:filename=each . split(/)[-1]with open(filename， WB )as f:img=URL _ open(each)f . write(img)def download(folder= ooxx pages=10):OS . mkdir(folder)OS . chdir(folder)#将当前目录切换到此目录URL= 3358jandan.net/ooxx page _ num=int(get _ page(URL))for I in range(pages):page _ num=page _ num-I page _ URL=URL /page- str(page _ num) # comments img _ addrs=find _ imgs(page _ URL)#此列表保存此页码找到的所有图片Save _ imgs (folder，img _ addrs) if _ _ name .