第三方库Python,python第三方库有哪些常用的,请列举15个
简介:Python data toolbox涵盖了从数据源到数据可视化完整过程中涉及到的常用库、函数和外部工具。有Python内置函数和标准库,也有第三方库和工具。
这些库可用于文件读写、网页抓取和解析、数据连接、数据清洗和转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发等Python协同数据工作工具。
为了区分不同对象的来源和类型,本文将通过以下方法在描述中对其进行标识:
Python内置函数:Python自带的内置函数。函数不需要导入,可以直接使用。例如,要计算-3.2的绝对值,可通过以下方式直接使用abs函数
绝对优势(-3.2)
Python标准库:Python自己的标准库。Python标准库不需要安装,只需要通过import方法导入就可以使用它的方法。例如,导入字符串模块,然后在其中使用find方法:
导入字符串
string.find(abcde , b )
第三方库:Python的第三方库。首先需要安装这些库(有些可能需要配置)。
外部工具:非Python编写的库或包,用于Python数据工作的相关工具。
“推荐”最高3星,最低1星。
01文件读写
文件的读写包括常见的txt、Excel、xml、二进制文件和其他格式的数据文本,主要用于本地数据的读写。
1.open(名称[,模式[,缓冲]])
类型:Python内置函数描述:Python默认文件读写方法推荐:
2.numpy.loadtxt、numpy.load和numpy.fromfile
类型:第三方库描述:Numpy自带的读写函数,包括loadtxt、load和fromfile,用于读写文本和二进制文件。建议:
3.熊猫. read_*
类型:第三方库描述:熊猫自己的读文件方法,如ead_csv、read_fwf、read_table等。用于文本、Excel、二进制文件、HDF5、表格、SAS文件、SQL数据库、Stata文件等的读写推荐。
4.读操作
类型:第三方库描述:推荐阅读Excel文件:
5.xlwt
类型:第三方库描述:写Excel文件推荐:
6.派塞尔xl
类型:第三方库描述:推荐读写Excel文件:
7.xluntils
类型:第三方库描述:推荐读写Excel文件:
8.pyExcelerator
类型:第三方库描述:推荐读写Excel文件:
9.安装
类型:第三方库描述:推荐读写Excel文件:
10.什么是
类型:第三方库描述:xml和HTML读取解析推荐:
11.可扩展标记语言
类型:Python标准库描述:xml对象解析和格式化处理推荐:
12.libxml2
类型:第三方库描述:xml对象解析和格式化处理推荐:
13.语言
类型:第三方库描述:xml对象解析和格式化处理推荐:
14.win32com
类型:第三方库描述:Windows系统操作、Office读写(Word、Excel等)相关的综合应用库推荐。)文件等。
02网络抓取和解析
Web爬行和解析用于从互联网上爬行信息和处理HTML对象。解析和处理xml对象的库可以在“01文件读写”中找到。
15.要求
类型:第三方库描述:网络请求库,提供多种网络请求方式,可以定义发送信息的复杂推荐度:
16.人人贷
类型:Python标准库描述:Python自己的库,它只是读取一个特定的URL并获取返回的信息推荐:
17.urllib2
类型:Python标准库描述:Python自己的库,读取特定的URL并获取返回的信息。与urllib相比,它可以处理更多的HTTP信息,如cookie、认证、重定向和其他建议:
18.urlparse
类型:Python标准库描述:Python自带的URL解析库,可以自动解析URL的不同域、参数、路径的推荐度;
19.解析器
类型:Python标准库描述:Python自带的HTML解析模块可以轻松实现HTML文件的分析和推荐:
20.Scapy
类型:第三方库描述:分布式爬虫框架,可用于模拟用户发送、侦听、解析、伪装网络消息,常用于大规模网络数据抓取推荐:
21.美味的汤
类型:第三方库描述:美汤是一款网页数据解析和格式化处理工具,通常与Python的urllib、urllib2等库配合使用。建议:
03数据库连接
数据库连接可以用来连接多个数据库,访问常用的数据库接口,可以用于数据库维护、管理、添加、删除、修改、搜索等日常操作。
22.MySQL-连接器-python
类型:第三方库描述:MySQL官方驱动连接器推荐:
23.已安装
类型:第三方库描述:MySQL连接库,支持Python3。建议:
24.安装
类型:第三方库描述:MySQL连接库推荐:
25.cx _甲骨文
类型:第三方库描述:Oracle连接库推荐:
26.心理战2
类型:第三方库描述:Python编程语言中非常流行的PostgreSQL适配器推荐:
27.存储
类型:Python标准库描述:Redis连接库推荐:
28.安装
类型:第三方库描述:MongoDB官方驱动连接器推荐:
29.快乐基地
类型:第三方库描述:HBase连接库推荐:
30.py2neo
类型:第三方库描述:二次连接库推荐:
31.卡珊德拉-司机
类型:第三方库描述:Cassandra(1.2)和DataStax Enterprise(3.1)连接库推荐:
32.sqlite3
类型:Python标准库描述:Python自带的用于操作SQLite数据库的模块推荐:
33.pysqlite2
类型:第三方库描述:SQLite 3.x连接库推荐:
34.bsddb3
类型:第三方库描述:Berkeley DB连接库
35.bsddb
类型:Python标准库描述:Python自带的模块,提供了对Berkeley DB库的接口建议:
36.dbhash
类型:Python标准库描述:Python自带的模块,dbhash模块提供了使用BSD数据库库打开数据库的功能。这个模块镜像了其他Python数据库模块的接口,提供了对DBM风格数据库的访问。Bsddb模块需要使用dbhash建议:
37.数据库异步操作
类型:第三方库描述:ADOdb是一个数据库抽象库,支持常用数据和数据库接口,可以自行扩展数据库。该库可以分析和区分不同数据库中的语法,具有高度的通用性;
38.SQLObject
类型:第三方库描述:SQLObject是一个流行的对象关系管理器,用于向数据库提供对象接口,其中表是类、行为实例、属性推荐度:
39.SQLAlchemy
类型:第三方库描述:SQLAlchemy是Python SQL工具包和对象关系映射器,为应用开发者提供了SQL的所有功能和灵活性。控制建议:
40.指针
类型:第三方库描述:ctypes是Python的外部库,提供了与C语言兼容的数据类型,可以方便地调用C DLL中的函数推荐:
41.pyodbc
类型:第三方库描述:Python通过ODBC访问数据库的接口库推荐:
42.脚本语言
类型:第三方库描述:Python通过JDBC访问数据库的接口库推荐:
04数据清理转换
数据清洗和转换主要用于正式应用前的数据预处理。
43.frozenset([iterable])
类型:Python内置函数描述:返回一个新的frozenset对象,可以选择从iterable获取的元素推荐度:
44.int(x)
类型:Python内置函数描述:返回x的整数部分推荐度:
45.isinstance(object,classinfo)
类型:Python内置函数描述:返回对象是否为指定的classinfo实例信息推荐度:
46.镜头
类型:Python内置函数描述:返回对象的长度或推荐的项数:
47.长型(x)
类型:Python内置函数描述:返回由字符串或数字X构造的长整型对象的推荐度:
48.max(iterable[,key])
类型:Python内置函数描述:返回两个或两个以上可迭代或最大化的参数中的最大项目推荐度:
49.min(iterable[,key])
类型:Python内置函数描述:返回两个或多个参数中最小项的迭代或最大推荐度
50.范围(开始、停止[、步进])
类型:Python内置函数描述:用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步骤)控制迭代次数并获得循环值建议:
51.原始输入(提示)
类型:Python内置函数描述:捕获用户输入并以字符串形式返回(不建议使用input作为用户输入的捕获函数)推荐:
52.round(数字[,ndigits])
类型:Python内置函数描述:返回ndigits的四舍五入浮点数在数字小数点后的建议:
53.集合([iterable])
类型:Python内置函数描述:返回一个新的集合对象,可以选择从iterable中获取的元素推荐度:
54.切片(开始,停止[,步进])
类型:Python内置函数描述:返回代表range (start,stop,step)指定的索引集的切片对象的推荐度:
55.已排序(可迭代[,cmp[,key[,reverse]])
类型:Python内置函数描述:从iterable的item返回新的排序列表推荐:
56.xrange(开始,停止[,步进])
类型:Python内置函数描述:该函数与range()非常相似,但返回一个xrange对象,而不是list建议:
57.线
类型:Python标准库描述:字符串处理库,可以实现字符串查找、分割、组合、替换、去重、大小写转换等格式化处理。建议:
58.是
类型:Python标准库描述:正则表达式模块,在文本和字符串处理中经常使用推荐度:
59.随意
类型:Python标准库描述:该模块实现了各种分布的伪随机数生成器,支持均匀数据分布、正态(高斯)分布、对数正态分布、负指数分布、伽玛和贝塔分布等推荐。
60.骨
类型:Python标准库描述:用于创建、删除、修改权限、切换路径、调用和执行系统命令等目录操作。建议:
61.os.path
类型:Python标准库描述:用于目录的遍历、合并、划分、判断等操作,常用于数据文件的判断、查找和合并。建议:
62.漂亮的桌子
类型:Python标准库描述:格式表输出模块推荐:
63.数据
类型:Python标准库描述:Python对象与json对象之间的转换建议:
64.base64
类型:Python标准库描述:Base16、Base32和Base64将任意二进制字符串编码和解码为文本字符串的建议:
05数据计算和统计分析
数据计算和统计分析主要用于数据探索、计算和初步的数据分析。
65.数组
类型:第三方库描述:NumPy是Python科学计算的基础工具包,很多Python数据计算工作库都依赖于它的推荐:
66.科学计算
类型:第三方库描述:Scipy是一套专门解决科学和工程计算不同场景的专题工具包。建议:
67.熊猫
类型:第三方库描述:Pandas是Python数据分析的库,主要功能是进行数据分析。Pandas为结构化数据分析提供了一个二维表格数据结构DataFrame,类似于R中的数据框架,可以提供切片、切块、聚集、子集选择等精细化操作。在数据库中,为数据分析提供方便的推荐:
68.统计模型
类型:第三方库描述:Statsmodels是Python的统计建模和计量经济学工具包,包含一些描述性统计、统计模型估计和统计检验。它集成了各种线性回归模型、广义线性回归模型、离散数据分布模型、时间序列分析模型、非参数估计、生存分析、主成分分析、核密度估计和广泛的统计测试和映射,以及其他功能建议:
69.abs(x)
类型:Python内置函数描述:返回x的绝对值推荐:
70.cmp(x,y)
类型:Python内置函数描述:比较两个对象X和Y,根据结果返回一个整数。如果x y,返回值为负,如果x==y,则为零,如果x y,返回值为正推荐:
71.浮动(x)
类型:Python内置函数描述:返回由数字或字符串X构造的浮点数的推荐度:
72.pow(x,y[,z])
类型:Python内置函数描述:返回x的y次方。如果z存在,则返回x的y次方,以及模数z推荐度:
73.sum(可迭代[,开始])
类型:Python内置函数描述:从左到右迭代,返回sum推荐:
74.数学
类型:Python标准库描述:数学函数库,包括正弦、余弦、正切、余切、弧度转换、对数运算、圆周率、绝对值、四舍五入等数学计算方法。建议:
75.数学函数
类型:Python标准库描述:基本和math一样,除了cmath运算复数推荐:
76.小数
类型:Python标准库描述:十进制浮点运算推荐:
77.分数
类型:Python标准库描述:分数模块提供了对有理数算术的支持。建议:
06自然语言处理和文本挖掘
自然语言处理和文本挖掘库主要用于自然语言文本的数据处理和建模。
78.自然语言处理
类型:第三方库描述:NLTK是Python自然语言处理工具,用于对自然语言进行分类、解析和语义理解。目前已经推荐了50多个语料库和词汇资源:
79.模式
类型:第三方库描述:Pattern是一个用于网络数据挖掘的Python工具包,为网络挖掘提供网络分析模型的推荐度(如网络服务、网络爬虫等。)、自然语言处理(如词性标注、情感分析等。)、机器学习(如向量空间模型、分类模型等。),图形网络分析:
80.根西姆
类型:第三方库描述:Gensim是专业主题模型(一种发现文字中隐藏主题的统计建模方法)的Python工具包,用于提供可扩展的统计语义,分析纯文本的语义结构,检索语义相似的文档推荐:
81.结巴分词
类型:第三方库描述:口吃分词是国内流行的Python文本处理工具包。分词模式分为三种模式:精准模式、全模式和搜索引擎模式。支持传统分词、自定义词典等。是非常好的Python中文分词解决方案,可以实现分词、词典管理、关键词提取、词性标注等推荐:
82.SnowNLP
类型:第三方库描述:SnowNLP是用Python编写的类库,可以方便的处理中文文本内容。这个库是受TextBlob启发,为中文处理而写的类库。与TextBlob不同,这里不使用NLTK。所有算法都是我们自己实现的,它附带了一些训练有素的字典推荐:
83.smallseg
类型:第三方库描述:Smallseg是一个开源的、基于DFA的轻量级中文分词工具包。可以自定义词典,切分后返回已登录词和未登录词列表,有一定的新词识别能力推荐度:
84.宽大的
类型:第三方库描述:spaCy是Python自然语言处理工具包,结合Python和Cython,使自然语言处理能力达到工业实力推荐:
85.文本Blob
类型:第三方库描述:TextBlob是一个处理文本数据的Python库,可用于词性标注、情感分析、文本翻译、名词短语提取、文本分类等推荐:
86.PyNLPI
类型:第三方库描述:PyNLPI是一个适合各种自然语言处理任务的集合库,可用于中文文本分词、关键词分析等。特别是,它支持中英映射,UTF-8和GBK编码字符串和其他建议:
87.同义词
类型:第三方库描述:中文同义词工具包,可用于自然语言理解的多项任务:文本对齐、推荐算法、相似度计算、语义偏离、关键词提取、概念提取、自动文摘、搜索引擎等。推荐学位:
07图像和视频处理
图像处理和视频处理主要应用于基于图像的运算、处理、分析和挖掘,如人脸识别、图像识别、目标跟踪、图像理解等。
88.PIL/枕头
类型:第三方库描述:PIL是图像读取、处理和分析的常用库,提供了多种数据处理和转换方法及属性。PIL只支持2.7版本,已经很久没有更新了。一群志愿者发布了一款以PIL为原型的新型树枝枕头。Pillow同时支持Python2和Python3,增加了很多新的功能推荐:
89.开放计算机视觉
类型:第三方库描述:OpenCV是一个功能强大的图像和视频作品库。它提供多种程序接口,支持跨平台(包括移动)应用。OpenCV的设计效率很高,用优化的C/C编写,库可以使用多核处理。除了基本的图像处理,还支持图像数据建模,预制了多种图像识别引擎,如人脸识别推荐:
90.sci kit-图像
类型:第三方库描述:scikit-image(又称skimage)是一个图像处理库,支持颜色模式转换、滤镜、绘图、图像处理、特征检测等功能。建议:
91.imageop
类型:Python标准库描述:Python自带的函数,对图像的基本操作,包括裁剪,缩放,模式转换。建议:
92.colorsys
类型:Python标准库描述:Python自带函数实现不同图像颜色模式的转换推荐:
93.imghdr
类型:Python标准库描述:Python自带的函数,返回图像文件的类型建议:
08音频处理
音频处理主要应用于基于声音的处理、分析和建模,主要应用于语音识别、语音合成、语义理解等。
94.时间方面
类型:第三方库描述:TimeSide是一个能够进行音频分析、成像、转码、流媒体和标签处理的Python框架,可以对任何具有非常大的音频或视频内容的数据集提出复杂的处理建议:
95.音频懒惰
类型:第三方库描述:audiolazy是一个实时音频数据流处理的库,支持实时数据应用处理、无限数据序列表示、数据流表示等推荐:
96.pydub
类型:第三方库描述:pydub支持各种格式的声音文件,可以进行各种信号处理(如压缩、均衡、归一化)、信号产生(如正弦、方波、锯齿等。)、音效注册、静音处理等。推荐学位:
97.音频操作
类型:Python标准库描述:Python自带的函数,可以实现声音剪辑的一些常见操作建议:
98.tinytag
类型:第三方库描述:tinytag用于读取各种声音文件的元数据,涵盖MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式。建议:
99.音频文件
类型:Python标准库描述:Python自带函数,读写AIFF和AIFC文件推荐:
100.苏瑙
类型:Python标准库描述:Python自带函数,读写Sun AU文件推荐程度:
101.波浪
类型:Python标准库描述:Python自带函数,读写WAV文件推荐程度:
102.矮胖的人或物
类型:Python标准库描述:Python自带函数,读取EA IFF 85块格式的文件推荐:
103.sndhdr
类型:Python标准库描述:Python自带的函数,返回声音文件的类型推荐:
104.ossaudiodev
类型:Python标准库描述:该模块支持访问OSS(开放声音系统)音频接口推荐:
09数据挖掘/机器学习/深度学习
数据挖掘、机器学习和深度学习是Python进行数据建模和挖掘学习的核心模块。
105.sci kit-学习
类型:第三方库描述:scikit-learn(又名SKlearn)是一个基于Python的机器学习综合库,内置了监督学习和非监督学习的机器学习方法,包括回归、聚类、分类、流学习、异常检测、神经网络和集成方法等各种主流算法类别。同时支持预置数据集、数据预处理、模型选择和评估等。这是一个非常完整和受欢迎的。
106.张量流
类型:第三方库描述:TensorFlow是Google的第二代机器学习系统,内置深度学习的扩展支持。任何可以用计算流程图表示的计算都可以使用TensorFlow建议:
107.核设施采购事务委员会
类型:第三方库描述:NuPIC是一个以HTM(分级时间记忆)学习算法为工具的机器智能平台。NuPIC适用于各种问题,尤其适用于检测异常和预测应用推荐:
108.PyTorch
类型:第三方库描述:PyTorch是FaceBook推出的深度学习框架。它基于Python(不是lua),提供的动态计算图与Tensorflow等其他学习框架有显著区别。推荐学位:
109.柑橘
类型:第三方库描述:Orange通过图形化的操作界面提供交互式的数据分析功能,特别适用于分类、聚类、回归、特征选择和交叉验证推荐:
110.theano
类型:第三方库描述:Theano是一个非常成熟的深度学习库。它与Numpy紧密集成,支持GPU计算、单元测试和自我验证建议:
111.深度学习
类型:第三方库描述:Keras是用Python编写的高级神经网络API,可以运行在TensorFlow或Theano上。其开发重点是实现快速实验推荐:
112.神经实验室
类型:第三方库描述:Neurolab是一个基本的神经网络算法库,具有灵活的网络配置和Python学习算法。它包含由递归神经网络(RNN)实现的不同变体,该库是同类RNN API中的最佳选择之一。推荐学位:
113.PyLearn2
类型:第三方库描述:PyLearn2是基于Theano的深度学习库。它旨在提供极大的灵活性,使研究人员可以自由控制。参数和属性的灵活和开放的配置是重点推荐:
114.吃得过多
类型:第三方库描述:OverFeat是一个深度学习库,主要用于图像分类和定位物体检测推荐:
115.肾盂肾炎
类型:第三方库描述:Pyevolve是一个完整的遗传算法框架,同时也支持遗传编程推荐:
116.咖啡2
类型:第三方库描述:Caffe2也是FaceBook推出的深度学习框架,比PyTorch更适合研究。Caffe2适合大规模部署,主要用于计算机视觉,对于图像识别的分类有很好的推荐:
10数据可视化
数据可视化主要用于数据结果展示、数据模型验证、图形交互和探索。
117.Matplotlib
类型:第三方库描述:Matplotlib是Python的2D图形库,生成各种硬拷贝格式和跨平台交互环境的出版质量图形。开发人员只需几行代码就可以生成各种高质量的图形推荐:
118.肾盂造影图
类型:第三方库描述:基于百度Echarts的强大可视化工具库,提供了很多图形功能,尤其是对于复杂关系的展示能力。强烈建议:
119.海生的
类型:第三方库描述:Seaborn是基于Matplotlib的更高级的API包,可以作为Matplotlib的补充推荐:
120.散景
类型:第三方库描述:Bokeh是一个交互式可视化库,可以在WEB浏览器中实现美观的视觉效果推荐:
121.Plotly
类型:第三方库描述:Plotly提供在线WEB交互的图形库,提供发布质量图形。支持折线图、散点图、面积图、条形图、误差线、框图、直方图、热图、子图、多轴、极坐标图、气泡图、玫瑰图、热图、漏斗图等多种图形推荐:
122.维斯比
类型:第三方库描述:VisPy是一个用于交互式科学可视化的Python库,旨在实现快速、可扩展、易用的推荐:
123.PyQtGraph
类型:第三方库描述:PyQtGraph是基于PyQt4/PySide和numpy的纯Python图形和GUI库,主要用于数学/科学/工程应用推荐:
124.ggplot
类型:第三方库描述:ggplot是用Python实现的图形输出库,类似于R中图形显示版本的推荐度:
11互动学习和综合发展
交互学习和集成开发主要用于Python开发、调试和集成,包括Python集成开发环境和IDE。
125.IPython/Jupyter
类型:第三方库描述:IPython是一个基于Python的交互式shell,比默认的Python shell好用很多。它支持变量自动补全、自动缩进、交互式帮助、魔法命令、系统命令等。它有许多有用的功能和内置的功能。从IPython4.0开始,IPython衍生出了两个分支:IPython和Jupyter。在这个分支正式出现之前,ipython其实已经有了IPython笔记本的功能。所以Jupyter更像是ipython笔记本的升级版。推荐学位:
126.埃尔比
类型:第三方库描述:Elpy是Emacs for Python的开发环境。它结合并配置了许多其他软件包,所有这些软件包都是用Emacs Lisp和Python的建议编写的:
127.PTVS
类型:第三方库描述:Visual Studio的Python工具推荐:
128.皮查姆
类型:外部工具描述:PyCharm自带一套完整的工具,可以帮助用户在用Python语言开发时提高效率,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制和IPython的集成、系统终端命令行等。几乎所有与Python工作相关的流程建议都可以在PyCharm中实现:
129.利普塞
类型:外部工具描述:LiClipse是基于Eclipse的免费多语言IDE,里面的PyDev可以支持Python开发,应用推荐:
130.Spyder
类型:外部工具描述:Spyder是一个开源的Python IDE,受IPython和很多流行的Python库支持。它是一个交互式开发环境,具有高级编辑、交互式测试、调试和数字计算环境。建议:
12个其他Python协作数据工作工具
其他Python协同数据工作工具是指除上述主题外,数据工作中常用的其他工具或库。
131.宇宙魔方光学字符识别
类型:外部工具描述:这是Google支持的开源OCR图形识别项目。支持200多种语言(包括中文),支持自定义训练字符集。它支持推荐度跨Windows、Linux、Mac OSX的多平台使用:
132.RPython
类型:第三方库描述:集成库r推荐:
133.Rpy2
类型:第三方库描述:Python连接R的库。
134.matpython
类型:第三方库描述:MATLAB集成库推荐:
135.疯狂蟒蛇
类型:第三方库描述:Lua集成库推荐:
136.PyCall.jl
类型:第三方库描述:Julia集成库推荐:
137.PySpark
类型:第三方库描述:Spark提供的Python API推荐:
138.笨蛋
类型:第三方库描述:该模块允许Pythoner轻松编写和运行Hadoop程序。程序版本较早,可以推荐作为参考:
139.设计广场
类型:第三方库描述:Spark的Python克隆版,类似MapReduce的框架推荐:
140.streamparse
类型:第三方库描述:Streamparse允许Python代码通过Storm在实时数据流上运行。建议:
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。