python把列表数据写入excel,如何用python把列表的内容写进excel里
一、应用场景
为了避免反复手动将一些数据表从后台数据库导出到Excel文件,高效导出多个离线数据。
二。功能事项
支持一次导出多个数据源表,自动获取每个表的字段名。
控制批次的写入速率。例如,每5000行向excel写入一批。
支持将结构相同的表格导入到同一个Excel文件中。水平分段后可以应用于分布式表。
三、主要实现
1.概观
A[创建类]-方法1 B(创建数据库连接)
A[创建类]-方法2 C(获取查询结果集)
A[创建类]-方法3 D(用句柄编写Excel)
A[ Create Class]-方法4 E(读取多个源表)
b(创建数据库连接)-U(调用示例)
c(获取查询结果集)-U(调用示例)
d(用句柄写Excel(调用示例)
e(读取多个源表)-U(调用示例)
2.主要方法
首先需要安装第三方库pymssql,实现对SQLServer的连接访问。自定义方法__getConn()需要指定以下五个参数:服务器主机、登录用户名、登录密码pwd、指定数据库db、字符代码charset。连接成功后,通过cursor()获取cursor对象,该对象将用于执行数据库脚本,获取返回的结果集和数据总量。
创建数据库连接并执行SQL源代码:
def __init__(自身,主机,用户,密码,数据库):
self.host=host
self.user=用户
self.pwd=pwd
self.db=db
def __getConn(self):
如果不是self.db:
引发(NameError,“未设置数据库信息”)
self . conn=pymssql . connect(host=self . host,user=self.user,password=self.pwd,database=self.db,charset=utf8 )
cur=self.conn.cursor()
如果不弯曲:
引发(名称错误,“无法连接到数据库”)
否则:
返回电流
3.在方法3中编写Excel时,一定要使用Pandas中的公共句柄Excelwriter对象编写器。当数据批量多次写入同一个文件时,如果直接使用to_excel()方法,前一批的结果集会被后续的结果覆盖。添加此公共句柄限制后,后续写入将累积到之前写入的数据的尾行,而不是完全覆盖它。
writer=pd。ExcelWriter(文件)
df_fetch_data[rs_startrow:i*N]。to_excel(writer,header=isHeader,index=False,startrow=startRow)
批量写入目标Excel时需要注意的另一个参数是write line startrow的设置。每次写入后,需要重新指向下一批数据的初始位置值。每个批次的数据都会记录自己的批次信息。
使用关键字参数**args指定多个数据源表和数据库连接。
def exportToExcel(self,**args):
对于args[sourceTB]中的sourceTB:
电弧_字典=字典(
sourceTB=sourceTB,
path=args[path],
startRow=args[startRow],
isHeader=args[isHeader],
batch=args[batch]
)
打印( \ n当前导出的数据表是:%s %(sourceTB))
self.writeToExcel(**arc_dict)
返回“成功”
第四,先用MSSQL-like创建对象,然后定义关键字参数args,最后调用方法导出到一个文件,完成数据导出。
#!/usr/gddxrz/env python
#编码:utf-8
#主要功能:批量将数据量大、结构相同的数据表导出到excel中。
#将多个表的数据导出到各自的文件中,
#当前问题:to_excel设置了批量写入,但是之前的数据会被下一次写入覆盖,
#使用Pandas包中的ExcelWriter()方法添加一个公共句柄,在写入新数据时保留原来写入的数据,在写入所有数据后关闭这个句柄。
导入pymssql
进口熊猫作为pd
导入日期时间
导入数学
MSSQL类(对象):
def __init__(自身,主机,用户,密码,数据库):
self.host=host
self.user=用户
self.pwd=pwd
self.db=db
def __getConn(self):
如果不是self.db:
引发(NameError,“未设置数据库信息”)
self . conn=pymssql . connect(host=self . host,user=self.user,password=self.pwd,database=self.db,charset=utf8 )
cur=self.conn.cursor()
如果不弯曲:
引发(名称错误,“无法连接到数据库”)
否则:
返回电流
def executeQuery(self,sql):
cur=self。__getConn()
当前执行(sql)
#获取所有数据集
# fetchall()获取结果集中的剩下的所有行
# 如果数据量太大,是否需要分批插入
resList,rowcount=cur.fetchall(),cur.rowcount
self.conn.close()
return (resList,rowcount)
# 导出单个数据表到超过
def writeToExcel(self,**args):
sourceTB=args[sourceTB]
columns=args.get(columns )
path=args[path]
fname=args.get(fname )
startRow=args[startRow]
isHeader=args[isHeader]
N=args[batch]
# 获取指定源数据列
如果列为无:
columns_select= *
否则:
columns_select=, .联接(列)
如果文件名为无:
fname=sourceTB _导出数据。xlsx
文件=路径名称
# 增加一个公共句柄,写入新数据时,保留原数据
writer=pd .ExcelWriter(文件)
SQL _ select= select columns _ select from 源TB
fetch_data,rowcount=self。执行查询(SQL _ select)
#打印(行数)
df_fetch_data=pd .数据帧(获取数据)
# 一共有roucount行数据,每普通行一个一批提交写入到超过
times=math.floor(行数/N)
i=1
rs_startrow=0
# 当总数据量每批插入的数据量时
打印(我,时代)
is_while=0
而我=乘以:
is_while=1
# 如果是首次,且指定输入标题,则有标题
如果i==1:
# isHeader=True
startRow=1
否则:
# isHeader=False
startRow=N
# 切片取指定的每个批次的数据行,前闭后开
# startrow:写入到目标文件的起始行。0表示第一行,1表示第2行。
df _ fetch _ data[ batch ]= batch str(I)
df_fetch_data[rs_startrow:i*N].to_excel(writer,header=isHeader,index=False,startrow=startRow)
打印(第,字符串(一),次循环,取源数据第,rs_startrow,行至,我*N,行,写入到第 startRow 行)
打印(第,字符串(一),次写入数据为:,df_fetch_data[rs_startrow:i*N])
# 重新指定源数据的读取起始行
rs_startrow=i * N
i=1
# 写入文件的开始行数
# 当没有做任何循环时,仍然从第一行开始写入
如果is_while==0:
startRow=startRow
否则:
startRow=N
df _ fetch _ data[ batch ]= batch str(I)
打印(第{0}次读取数据,从第{1}行开始,写入到第{2}行!。格式(str(i),str(rs_startrow),str(startRow)))
打印(第,字符串(一),写入数据为:,df_fetch_data[rs_startrow:i*N])
df_fetch_data[rs_startrow:i*N].to_excel(writer,header=isHeader,index=False,startrow=startRow)
# 注:这里一定要保护程序()将数据从缓存写入磁盘!!!一
writer.save()
开始时间=日期时间。日期时间。现在()
# 导出结构相同的多个表到同一样超过
def exportToExcel(self,**args):
对于args[sourceTB]中的sourceTB:
电弧_字典=字典(
sourceTB=sourceTB,
path=args[path],
startRow=args[startRow],
isHeader=args[isHeader],
batch=args[batch]
)
打印( \n当前导出的数据表为:% s"%(sourceTB))
self.writeToExcel(**arc_dict)
返回"成功"
开始时间=日期时间。日期时间。现在()
if __name__==__main__ :
ms=MSSQL(host=localhost ,user=test ,pwd=test ,db=db_jun )
args=dict(
sourceTB=[tb2 , tb1],#待导出的表
path=D:\\myPC\\Python\\ ,#导出到指定路径
startRow=1,#设定写入文件的首行,第2行为数据首行
isHeader=False,#是否包含源数据的标题
批次=5
)
# 导出多个文件
exporttoexcel女士(* *参数)
以上这篇使用计算机编程语言实现将多表分批次从数据库导出到超过就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
本文标题:使用计算机编程语言实现将多表分批次从数据库导出到超过
本文地址:http://www . CPP cns . com/jiao Ben/python/313484 . html
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。