python编程入门书籍推荐,python编程哪本书好

  python编程入门书籍推荐,python编程哪本书好

  (图片来自网络)

  你好,我是听起来很舒服的芹菜~

  上图是今年9月TIOBE统计编程语言排行榜。

  可以看到Python跃居第二。

  超越C语言成为第一将是编程语言史上的重要时刻。

  现在开始学习Python的人也越来越多。

  相信你在学习Pythond的时候也会遇到这样的问题。

  该买哪本python的书?

  愉快的芹菜是通过收集网上销售的6000本Python书籍获得的。

  包括(书名-价格-出版社-出版时间-销量))。

  通过视觉分析,哪些书适合你?是销售吗?还是标题?或者值得信赖的出版社?还是价格区间?

  收集数据

  共100页,每页60张。

  有6000条数据(这本书)

  分析页面

  每页六十本书的信息都在李的标签上一一标注。

  比如在这本书里,考察了哪些web标签包含了可以对应书名的web源代码等等。

  大照片

  URL= http://search.Dangdang.com/key=python act=input page _ index= str(page)RES=requests . get)URL,headers=headers (text=RES.text选择器=etree . html)text)Li _ list=选择器。XPath)@ id= com pood p[@ class= name ]/a/@ title )0]price= )Date=I . XPath(。/p[@ class= search _ book _ au author text()(out=I . XPath))))652 p[@ class= parch _ star _ line ]/a/text((),其中Parch _

  最后收集了6000本书。

  可视化分析

  A.书名词云图

  从csv中抽取书名列,做单词图。

  可以看出,大部分书名都包含两个关键词:入门编程

  芹菜,听起来很舒服,推测这样的名字可能对大力的羊更有吸引力。

  r;另外,python目前在机器学习(人工智能)领域非常热门,相关书籍也越来越多,其次是爬虫、图书分析、自动化办公等等。

  B.每年出版python书籍数量

  从csv中读出发布时间列

  数一数每本书的出版年份。

  画一个折线图

  Time=df[发布时间]。to list()dict={ } for Jin[str(I)[0:4]for iintime]:if(j!= nan ):try:dict[str(j)]=dict[str(j)]1 except:dict[str(j)]items(),key=lambdax:x[0],Reverse=false)key=[I[0]for dict]value=[I[1]for dict]c=(line()。add _ xaxis (key)。add _ yaxis(每年出版的Python书籍数量,值,Is _ smooth=true)。set _ global _ opts(title _ opts=opts。title opts(title= quantity(Python研究者))。render(line_smooth.html ))

  可以看到,在2009年之前,每年只有十几本或者几十本Python书籍出版,只有

  2010年突然增加到311。

  香芹检查了原因:

  2010年是python第二次风靡全球,因为OpenStack是用Python编程语言编写的项目,2010年Python再次流行起来。

  (OpenStack具体是什么?让我们搜索一下。)

  然后开始沉默。从2016年到现在,Python的热度从未停止并迅速飙升~ ~ ~

  从每年出版的python书籍数量可以看出,Python一直都很热,而且还在增长。

  C.出版社出版python书籍数量排名

  从csv中读出出版社列

  统计一下每本书属于哪个出版社,积累一下。

  Out=df[出版社]。to list()dict={ } for Jin[str(I)for out]:if(j!= nan ):try:dict[str(j)]=dict[str(j)]1 except:dict[str(j)]items(),key=lambdax:x[1],reverse=True)

  出版Python书籍的出版社太多了。

  这里只选取甜芹菜的前10篇出版物进行直方图绘制。

  D.Python书籍售价区间

  从csv中读出价格列

  统计价格范围

  不到30/[30-50]/[50-70]

  [70-100)/[100-120)/[120-150)

  [超过150]

  Out=df[ price]。tolist () dict={under 30: 0,[30-50]: 0,[50-70]:0,[70-100]: 0,[100-120= nan ):if(int(j)30):dict[ under 30 ]=dict[ under 30 ]1 elf((int(j)50)):dict[[30-50]]=dict[[30-30]items(),key=lambdax: x [1],reverse=

  从图中可以看出,价格区间越靠后,销量越低(30元以下除外)。

  价格刚好在50-70左右,所以销量比较好。

  最后

  1.本文分享了如何收集数据和可视化分析收集的数据。

  2.分析6000本Python书籍的销量,分析结果仅来自个人观点,仅供参考。

  3.本文仅供参考,不做其他用途。

  4.点击【寻找】找到甜芹菜接收本文的数据集和完整源代码。

  8个很少用,但是非常好用的Python库。让我们看一看。

  2021-09-28

  JupyterLab的Windows桌面版出来了!

  2021-09-27

  10个超级实用的Python小技巧,可以直接应用,省时省力!

  2021-09-26

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: