与大数据相关的书籍,大数据方面的书籍推荐
当然不能只说转行,还是要努力的,所以我买了很多书,也获赠了很多书。以下是我在过去一年半时间里看过的一些相关书籍:
结构化查询语言
SQL学习指南
个人推荐指数:
SQL是学习数据分析和挖掘的必备。我读这本书是因为我以前买过它。个人感觉初学者会纠结多表连接和查询很久。当然,我不是很擅长SQL,还需要加强。可惜这本书上的数据好像没有提供,我没法实践。
计算机编程语言
Python基础教程
个人推荐指数:
书的内容是用Python2写的,不适合初学者学习。因为Python2不会很快维护,不如学Python3,而且在JD.COM等商场卖的很好。但不建议作为入门书,因为第六章开始写参数魔法,初学者会很难理解。入门书要生动有趣,通俗易懂,这也是我从零开始写Python的原因之一。
听说第三个出版的版本是Python3写的。
像计算机科学家一样思考Python
个人推荐指数:
这本书销量很高,我看的时候印象最深的就是递归的思想。如果你已经看过我的《Python入门基础教程》,那就没必要看这本书了。这本书相对多余的知识点在前几篇Python高级文章里已经写过了。这本书不适合作为入门书,因为每一点都不全面。
HeadFirstPython
个人推荐指数:
这本书是我接触Python看的第一批书之一。书中有大量的插图,使用Python可以解决一些实际问题。初学者可以不按照这本书的内容去理解代码就行了,因为这本书的代码太多,可能会让初学者开始放弃。
Python程序设计基础
个人推荐指数:
这本书推荐给喜欢应试教育的朋友,作为入门书也很合适。基于Python3编写,Python加入了全国计算机二级考试。这本书作为教材也很ok。
光滑蟒蛇皮
个人推荐指数:
这本书献给那些想更优雅地写Python的朋友。通过深入分析Python的深层内容,认真阅读,每一章都有很大的收获。当然,书很厚,我还没看完。
网络爬虫
精通Python网络爬虫
个人推荐指数:
我是通过大方的看老师的视频来学习网络爬虫的,简单易懂,很棒!这本书出版后,我又读了一遍。该书对网络爬虫、urllib库、正则表达式和scrapy的原理进行了详尽的解释。推荐大家看看BeautifulSoup,xpath等功能强大的解析库。这本书使用Fiddler抓取数据包进行分析,但我推荐Google Chrome的开发者模式。
数据分析
简单的数据分析
个人推荐指数:
这本书适合作为学习数据分析的入门书籍。书中有大量的插图,生动的形象和简单的解释。每一章都是为了解决具体问题而反复思考迭代。
机器学习
白话大数据和机器学习
个人推荐指数:
推荐这本书做入门机器学习。不用担心书中的代码。看看每一种机器学习的例子。很好理解。书中漫画插图较多,算法原理推导基本不深入,尤其是隐马尔可夫部分。作为一本机器学习入门书籍非常棒!
机器学习
个人推荐指数:
《周志华老师的机器学习》应该算是国内机器学习书籍销量最高的了。除了国外的书,这是你学习机器学习必看的经典书籍(因为我知道国外有几本经典的机器学习书籍)。这本书从西瓜数据开始,到西瓜数据结束,每个算法都是从点到点运行的(不是说深度不够,这里指的是篇幅不是废话)。对我帮助最大的是本书第二章的模型评估和选择,非常系统。当然,书中的理论推导是很难的。有兴趣可以看一些学习笔记。
机器学习基础课程
个人推荐指数:
这本书是一本理论书,从线性回归入手,详细推导了所有的最小二乘法和最大似然法,热情满满。之后的贝叶斯方法和贝叶斯推理太理论化,让人想撕书,但是很好理解,然后的分类,聚类,降维也没啥特色。数学好的同学可以挑战一下,看看。
集体规划
个人推荐指数:
这本书的Python代码是2版,书比较老(经典)。我看了一部分就放弃了这本书,因为书里的数据提供的很多网站都失败了。不过这本书的想法还是不错的,以后还会回来看看。
机器学习实战
个人推荐指数:
这本书很有力量。基本上不需要sklearn等人做的轮子。基本上你自己定义函数来实现功能。对你从底层理解机器学习代码的实现很有帮助。评论不够多,可能会不明白某个代码的意思。可以用打印功能输出,然后理解。如果你遇到新的方法,你可以利用它。因为书比较老,有些方法已经改了或者不用了。试试百度最新的替代方法。
Python机器学习与实践
个人推荐指数:
全书180页,不到两天就能看完。书中提供的代码是Python2。如果稍微修改一下,换成Python 3再运行。如果你有Python基础,你会跳过第一章。第二章将实现常用的机器学习算法,主要是sklearn。看完这一章,你就知道用sklearn进行机器学习的步骤了:导入数据,预处理数据,训练数据训练模型,测试数据。第三章是本书的两个点,讲的是特征提升,模型正则化,模型验证,超参数搜索优化。在这本书里,很好的解释了模型的欠拟合和过拟合部分,然后介绍了一些流行的库,包括NLTK,Word2Vec,XGBoost,Tensorflow,涉及到自然语言处理和深度学习。本书原理简述,最后一章讲鼓励参与Kaggle竞赛,并给出三个案例进行说明。这本书适合学过sklearn基础知识,想用sklearn实现一个完整的机器学习项目的朋友。缺点是书上的模型基本都是用默认参数。
统计学习方法
个人推荐指数:
想学数据挖掘或者机器学习,必然要接触数学相关的理论。虽然你只能用sklearn做机器学习,但是如果你不了解底层的理论,是无法深入做的。而且这本书是为机器学习打好基础的书。第一门课是大学数学三件套(高等数学、线性代数、概率论、数理统计)。如果你没有特别好的数学基础,看这本书的时候也不会像我一样看懂一些公式推导。不要慌,百度看别人的学习笔记或者技术博客,慢慢学习。这本书适合多次阅读,每次都有新的收获。这本书本身并不厚,有230页。建议边看边在旁边写上感悟推导公司,方便下次阅读。
数据挖掘技术
数据挖掘简介
个人推荐指数:
这是入门,所以不要简单的认为他很难理解。第一章是绪论,第二章详细讨论了数据的概念。你会接触到很多不熟悉的术语,分类算法就不多讲了。SVM对内核函数的介绍尤为生动。这本书在相关性分析和聚类分析上花了很多笔墨,深入挖掘。这本书的最后讲的是异常检测,书里全是理论,但什么都没说。
数据结构算法
大话数据结构
个人推荐指数:
如果你还是在校学生,想通过校招找到一个数据分析与挖掘或者机器学习的岗位,那么不可避免的会面临数据结构算法的问题。如果你和我一样是非专业人士,又是数据结构算法新手,你会很笨。那么我向你推荐这本书,里面有很多插图可以帮助你理解
学无止境。要坚持阅读,总结,提高。还有很多书等着我去读,以后会继续分享给大家~
买书如山,读书如丝,不要只有三分钟热度,学习是一场持久战,哦不,是一个持久快乐的过程。
买书的时候可以经常逛逛JD.COM和当当。年中中国大学促进会好像有五折优惠。通常情况下,也有折扣。最近当当有图书100-40的优惠(我要去拿盒饭)。
人工智能、大数据、云计算、物联网的未来发展值得关注,都是前沿产业。多智能时代重点介绍人工智能和大数据的介绍和科学谱。在这里,我给大家推荐几篇质量很高的好文章:
进入大数据科学领域,我们需要具备哪些数学基础?
http://www.duozhishidai.com/article-14941-1.html
数据科学家的工作性质是什么,他们面临的主要挑战是什么?
http://www.duozhishidai.com/article-13986-1.html
什么是数据科学,如何成为一名数据科学家?
http://www.duozhishidai.com/article-8521-1.html
多元智能时代-人工智能与大数据学习介绍网站人工智能、大数据、物联网、云计算学习交流网站
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。