最近整理了一些有用的数据库,但只是初级介绍。如果能用的话,请去官网查一下。因为东西太多,我介绍可能不太现实。有需要的朋友可以参考一下。
目录
一、导论二、前戏三、Python标准库四、科学计算与统计五、数据处理与分析六、可视化七、机器学习、深度学习与强化学习八、自然语言处理
一、导读
通常情况下,开发大量的原代码是一件费时费力的工作,有时我们并不能理解所有的专业知识。为了避免这种情况,我们将使用库中尽可能多的类来创建对象,通常只需要一行代码。因此,库可以帮助我们用适量的代码执行重要的任务。我想这也是python能活跃在我们身边的原因之一。欢迎大家喜欢收藏,以后借鉴。
二、前戏
刚才忘了说了,你在用python的时候,我还是推荐下一个集成开发环境Anaconda,它可以更好的管理这些第三方库文件。它的好处是,只有当你实际使用过它,你才会知道旧规则。要用的话自己去查。老师说:“程序员最长的两条路,一是自己去百度;二是找别人帮你百度!"这真是一句名言。
三、Python标准库
有时候你可能想不到python标准库中有这么多函数。Python标准库提供了丰富的功能,包括文本/二进制数据处理、数学运算、函数式编程、文件/目录访问、数据持久化、数据压缩/归档、加密、操作系统服务、并发编程、进程间通信、网络协议、JSON/XML/其他互联网数据格式、多媒体、国际化和国际化。下面列出了一些Python标准库模块。
Difflib:一个计算差异的工具
集合:基于列表、元组、字典和集合的增强数据结构。
Csv:处理带有逗号分隔值的文件。
日期时间,时间:日期和时间操作。
十进制:定点或浮点运算,包括货币计算。
Doctest:通过验证嵌入在docstring中的测试或预期结果的简单单元测试。
Json:为Web服务和NoSQL文档数据库处理JSON(JavaScript对象表示法)数据。
数学:常见的数学常数和运算。
Os:与操作系统交互。
队列:先进先出的数据结构。
Random:伪随机数运算。
Re:用于模式匹配的正则表达式。
Sqlite3:SQLite关系数据库访问。
统计学:数学统计函数,如均值、中位数、众数和方差等。
sys:—命令行参数处理,如标准输入流、输出流和错误流。
时间:性能分析。
字符串:常规字符串操作
文本换行:文本填充
Unicode数据:Unicode字符数据库
准备:互联网字符串准备工具
Readline:GNU逐行读取接口
Rl完成器:GNU逐行读取的实现函数
Python有一个庞大且仍在快速增长的开源社区,开发者来自许多不同的领域。这个社区有大量的开源库,这也是Python受欢迎的最重要原因之一。
很多任务只用几行Python代码就能完成,太神奇了。下面列出了一些流行的数据科学库。
四、科学计算与统计
Numpy(数值Python): Python没有内置数组数据结构。它提供的列表类型使用起来更方便,但处理速度较慢。NumPy提供了高性能的ndarray数据结构来表示列表和矩阵,还提供了处理这些数据结构的操作。
Scipy(科学Python): Scipy是在NumPy的基础上开发的,增加了科学处理的程序,如积分、微分方程、附加矩阵处理等。SciPy.org负责科学和数字。
StatsModels:为统计模型评估、统计测试和统计数据研究提供支持。
Iphon是Python的科学计算标准工具集的一个组成部分,它可以将许多东西连接在一起,有点类似于增强的Python shell。目的是提高编程、测试和调试Python代码的速度。好像国外很多大学教授和谷歌大牛都喜欢用IPython,真的很方便。
五、数据处理与分析
Pandas:一个非常受欢迎的数据处理库。Pandas充分利用了NumPy的ndarray类型,它的两个关键数据结构是Series(一维)和DataFrame(二维)。
Modin[14] pandas加速库,接口语法与pandas高度一致。
Dask[15] pandas加速库,接口语法与pandas高度一致。
Plydata[16] pandas管道语法库
六、可视化
E Charts E Charts是百度开源的数据可视化,以其良好的交互性和精美的图表设计得到了众多开发者的认可。Python是一种表达性语言,非常适合数据处理。Pyecharts是在数据分析遇到数据可视化的时候诞生的。
Matplotlib:一个高度可定制的可视化和绘图库。Matplotlib可以绘制常态图、散点图、直方图、等高线图、饼图、矢量场图、网格图、极坐标图、3D图并添加文字描述等。
Seaborn:基于Matplotlib的高级可视化库。与Matplotlib相比,Seaborn改进了外观,增加了可视化方法,可以用更少的代码创建可视化。
七、机器学习、深度学习和强化学习
Scikit-learn:一个顶级的机器学习库。机器学习是AI的子集,而深度学习是机器学习的子集,侧重于神经网络。
Keras:最易用的深度学习库之一。Keras运行在TensorFlow(谷歌)、CNTK(微软的深度学习认知工具包)或Theano(蒙特利尔大学)上。
TensorFlow:由Google开发,是应用最广泛的深度学习库。TensorFlow在与GPU(图形处理单元)或谷歌定制的TPU(张量处理单元)配合使用时,可以获得最佳性能。TensorFlow在人工智能和大数据分析中起着非常重要的作用,因为人工智能和大数据对数据处理有着巨大的需求。
OpenAI Gym:一个用于开发、测试和比较强化学习算法的库和开发环境。
Pytorch Pytorch是torch的python版本,torch是脸书的开源神经网络框架。它是专门为GPU加速的深度神经网络(DNN)编程的。Torch是一个用于操作多维矩阵数据的经典张量库,广泛用于机器学习和其他数学密集型应用。与Tensorflow的静态计算图不同,pytorch的计算图是动态的,可以根据计算需要实时变化。但由于Torch语言采用了Lua,在国内一直很小众,逐渐被支持Python的Tensorflow抢走。PyTorch作为经典机器学习库Torch的移植,为Python语言用户提供了编写代码的舒适选择。
八、自然语言处理
NLTK(自然语言工具包):用于完成自然语言处理(NLP)任务。
TextBlob:一个面向对象的NLP文本处理库,基于NLTK和pattern NLP库,简化了很多NLP任务。
Gensim:功能类似于NLTK。它通常用于为文档集合建立索引,然后确定另一个文档与索引中每个文档的相似程度。
你对Python的这些库了解多少?文章到此结束。更多相关Python库内容,请搜索我们之前的文章或者继续浏览下面的相关文章。希望大家以后能多多支持我们!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。