python 保存图片,python自动保存图片

  python 保存图片,python自动保存图片

  这篇文章主要为大家详细介绍了如何利用计算机编程语言语言实现快速保存微信公众号文章中的图片,文中的示例代码讲解详细,感兴趣的可以尝试一下

  

目录
一、实现效果(以槿泉壁纸为例)二、实现过程三、源码四、Python正则表达式匹配日期与时间

  

一、实现效果(以槿泉壁纸为例)

  

二、实现过程

  1.新建一个环文本,将需要下载的文章链接依次保存;

  2.新建一个。巴拉圭文件,将下面的源码复制进去;

  3.新建一个电影文件夹,用来保存图片;

  4.运行即可;

  

三、源码

  声音代码

  代码如下(示例):

  导入请求

  从重新导入查找所有

  从bs4导入美丽的声音

  导入时间

  导入操作系统

  导入系统

  weixin_title=

  weixin_time=

  #获取微信公众号内容,保存标题和时间

  def get_weixin_html(url):

  全球微信_时间,微信_标题

  res=requests.get(url)

  soup=BeautifulSoup(res.text, html.parser )

  #获取标题

  temp=soup.find(h1 )

  weixin_title=temp.string.strip()

  #使用正则表达式获取时间

  # result=find all(r [0-9]{ 4 }-[0-9]{ 2 }-[0-9]{ 2 } .[0-9]{2} ,研究文本)

  result=findall(r(\d{4}-\d{1,2}-\d{1,2}),res.text)

  weixin_time=result[0]

  #获取正文超文本标记语言并修改

  内容=汤。查找(id= js _ content )

  soup 2=漂亮的汤((str(content)), html.parser )

  汤2。div[ style ]=可见性:可见;

  html=str(soup2)

  pattern=rhttp[s]?\/\/[a-z.A-Z_0-9\/\?=-_-]

  result=findall(模式,html)

  #将数据-src修改为科学研究委员会

  对于结果:中的全球资源定位器(Uniform Resource Locator)

  html=html。替换( data-src= url , src= url )

  返回超文本标记语言

  #上传图片至服务器

  极好的下载_pic(内容):

  pic_path=pic/ str(path) /

  如果不是os.path.exists(pic_path):

  os.makedirs(pic_path)

  #使用正则表达式查找所有需要下载的图片链接

  pattern=rhttp[s]?\/\/[a-z.A-Z_0-9\/\?=-_-]

  pic_list=findall(模式,内容)

  对于索引,枚举中的项目(图片_列表,1):

  计数=1

  标志=真

  pic_url=str(item)

  而标志和计数=10:

  尝试:

  数据=请求。get(pic _ URL);

   if pic_url.find(png)>0:

   file_name = str(index)+.png

   elif pic_url.find(gif)>0:

   file_name=str(index)+.gif

   else:

   file_name=str(index)+.jpg

   with open( pic_path + file_name,"wb") as f:

   f.write(data.content)

   #将图片链接替换为本地链接

   content = content.replace(pic_url, pic_path + file_name)

   flag = False

   print(已下载第 + str(index) +张图片.)

   count += 1

   time.sleep(1)

   except:

   count+=1

   time.sleep(1)

   if count>10:

   print("下载出错:",pic_url)

   return content

  def get_link(dir):

   link = []

   with open(dir,r) as file_to_read:

   while True:

   line = file_to_read.readline()

   if not line:

   break

   line = line.strip(\n)

   link.append(line)

   return link

  path = link.txt

  linklist = get_link(path)

  print(linklist)

  s = len(linklist)

  if __name__ == "__main__":

   #获取html

   input_flag=True

   while input_flag:

  # for j in range(0,s):

  # pic = str(j)

   j = 1

   for i in linklist:

   weixin_url = i

   path = j

   j += 1

   #weixin_url=input()

   re=findall(rhttp[s]?:\/\/mp.weixin.qq.com\/s\/[0-9a-zA-Z_]+,weixin_url)

   if len(re)<=0:

   print("链接有误,请重新输入!")

   else:

   input_flag=False

   content=get_weixin_html(weixin_url)

   content=download_pic(content)

   #保存至本地

   with open(weixin_title+.txt,w+,encoding="utf-8") as f:

   f.write(content)

   with open(weixin_title+.html,w+,encoding="utf-8") as f:

   f.write(content)

   print()

   print("标题:《"+weixin_title+"》")

   print("发布时间:"+weixin_time)

  

  

  

四、Python正则表达式匹配日期与时间

  

  import re

  from datetime import datetime

  test_date = 小明的生日是2016-12-12 14:34,小张的生日是2016-12-21 11:34 .

  test_datetime = 小明的生日是2016-12-12 14:34,.小晴的生日是2016-12-21 11:34,好可爱的.

  # date

  mat = re.search(r"(\d{4}-\d{1,2}-\d{1,2})",test_date)

  print mat.groups()

  # (2016-12-12,)

  print mat.group(0)

  # 2016-12-12

  date_all = re.findall(r"(\d{4}-\d{1,2}-\d{1,2})",test_date)

  for item in date_all:

   print item

  # 2016-12-12

  # 2016-12-21

  # datetime

  mat = re.search(r"(\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2})",test_datetime)

  print mat.groups()

  # (2016-12-12 14:34,)

  print mat.group(0)

  # 2016-12-12 14:34

  date_all = re.findall(r"(\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2})",test_datetime)

  for item in date_all:

   print item

  # 2016-12-12 14:34

  # 2016-12-21 11:34

  ## 有效时间

  # 如这样的日期2016-12-35也可以匹配到.测试如下.

  test_err_date = 如这样的日期2016-12-35也可以匹配到.测试如下.

  print re.search(r"(\d{4}-\d{1,2}-\d{1,2})",test_err_date).group(0)

  # 2016-12-35

  # 可以加个判断

  def validate(date_text):

   try:

   if date_text != datetime.strptime(date_text, "%Y-%m-%d").strftime(%Y-%m-%d):

   raise ValueError

   return True

   except ValueError:

   # raise ValueError("错误是日期格式或日期,格式是年-月-日")

   return False

  print validate(re.search(r"(\d{4}-\d{1,2}-\d{1,2})",test_err_date).group(0))

  # false

  # 其他格式匹配. 如2016-12-24与2016/12/24的日期格式.

  date_reg_exp = re.compile(\d{4}[-/]\d{2}[-/]\d{2})

  test_str= """

   平安夜圣诞节2016-12-24的日子与去年2015/12/24的是有不同哦.

   """

  # 根据正则查找所有日期并返回

  matches_list=date_reg_exp.findall(test_str)

  # 列出并打印匹配的日期

  for match in matches_list:

   print match

  # 2016-12-24

  # 2015/12/24

  

  以上就是Python实现快速保存微信公众号文章中的图片的详细内容,更多关于Python保存文章图片的资料请关注盛行IT软件开发工作室其它相关文章!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: