.py文件怎么运行,python的pyc文件怎么运行
Q3:如何使用Python读取大文件?
我先假设题主问的大文件是1G~20G左右,应该算是正规的大文件。通常我做机器学习模型的时候,喜欢先在这台机器上做玩具模型。这里面有一个步骤,就是我经常要读取文件数据,数据量差不多。
一般来说,Python可以通过使用原生的open函数或者pandas的read_csv函数来读取大文件。开放功能
Python文件一般通过open函数读取。比如f=open(xx, r )之后,文本内容就可以很容易地被f.read()读取。
如果数据很大,可以通过read (parameter)或readline()迭代读取。具体代码如下:read_csv()
Read_csv是Python中著名的数据分析工具包pandas中的一个函数。它可以读取txt和csv格式的文件。read_csv中的一个参数是chunksize,通过指定chunksize块大小来读取文件。具体代码如下:
另一个参数是iterator,它可以把一个文件对象变成一个可迭代的对象,只要iterator=True。具体代码如下:
当然,我的内存只有8G,所以阅读速度会慢一些,所以我花了一些时间来研究。有了上面这些神奇的技巧,阅读速度真的快了很多。当然,如果你有更好的方法或建议,欢迎在评论区随时讨论交流,互相学习。
如果你对学习人工智能和科技新闻感兴趣,请订阅我的头条号。我会在这里张贴所有与技术、科学和机器学习相关的有趣文章。我也偶尔回答有趣的问题。如有疑问,欢迎在评论区回复讨论。我一见到他们就回来。
(码字不易,如果文章对你有帮助,可以点赞支持~)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。