导读:今天首席CTO笔记来给各位分享关于python检测文件有多少行的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
python统计文本中有多少行
写一个文本统计的脚本:计算并打印有关文本文件的统计数据,包括文件里包含多少个字符、行、单词数,以及前10个出现次数最多的单词按顺序排列
import time
keep=['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z',' ','-',"'"]
stop_words=['the','and','i','to','of','a','you','my','that','in','she','he','her','his','it','be','was','had']
def normalize(s):
result=''
for c in s.lower():
if c in keep:
result+=c
如何用python最快的获取大文件的最后几行
工作中经常会遇到处理日志文件的问题:为了得到日志的最新状态,我们需要获取日志文件的最后部分行来做判断。那么,这种情况下我们应该怎么做呢?
1)常规方法:从前往后依次读取
步骤:open打开日志文件。
读取文件,获取文件的总行数。
遍历所有行,提取指定行的数据。
优点:简单,方便
缺点:当文件大了以后时间太慢,无法忍受
2)推荐方法:
步骤:open打开日志文件。
移动文件读取指针到文件末尾。
从后往前移动指针直到合适的位置。
读取文件,提取指定行的数据。
优点:时间相对固定,适合处理大文件
示例:
[python] view plain copy
logFile = open('logFilePath.log', 'r')
logFile.seek(0,2)
logFile.seek(-1000000,2)
rowCount = 0
for row in logFile.readlines()[1:]:
pass
seek():移动文件读取指针到指定位置
tell():返回文件读取指针的位置
seek()的三种模式:
(1)f.seek(p,0) 移动当文件第p个字节处,绝对位置
(2)f.seek(p,1) 移动到相对于当前位置之后的p个字节
(3)f.seek(p,2) 移动到相对文章尾之后的p个字节
python 记录读取文件多少行,下次继续从上次
可以先把所以的数据放在一个1.txt文件,再建一个2.txt,把读到的最后那行保存为一个2.txt文件,里面只有你读取过程中,最后成功处理的文件路径名称,下次通过这个2.txt去1.txt里面找到第几行,程序接着这一行继续就行了。
如何利用python文件操作快速定位到多少行
首先需要用open()函数打开文件,然后调用文件指针的readlines()函数,可以将文件的全部内容读入到一个列表当中,列表的每一个元素对应于文件的每一行,如果希望获取文件第k行的内容,只需要对列表索引第k-1个元素即可,因为Python是从0开始计数的。
示例代码如下:
示例代码中,打印了文件第4行的内容。
结语:以上就是首席CTO笔记为大家介绍的关于python检测文件有多少行的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。