导读:很多朋友问到关于python查询共有多少数据的相关问题,本文首席CTO笔记就来为大家做个详细解答,供大家参考,希望对大家有所帮助!一起来看看吧!
python中如何查看两个表的数据量
1、首先开启电脑并打开软件python,其次在python内创建两个表的数据量并选择查看。
3、最后点击立即查看即可。
python数据分析怎样查有多少行数据
from __future__ import print_functionimport timeif __name__ == '__main__':
import sys
start = time.time()
with open(sys.argv[1],'rb') as f:
count = 0
last_data = '\n'
while True:
data = f.read(0x400000)
if not data:
break
count += data.count(b'\n')
last_data = data
if last_data[-1:] != b'\n':
count += 1 # Remove this if a wc-like count is needed
end = time.time()
print(count)
print((end-start) * 1000)
这跟wc -l略有区别,如果要跟wc -l一致的话,可以将带注释的行删掉。
这里没有处理universal newline、忽略空行等逻辑,如果需要这些功能,程序会变得复杂一些。
python panda 统计一列有多少数据
创建数据
通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。
In [3]: import pandas as pd
In [4]: import random
In [5]: num = random.sample(xrange(10000, 1000000), 5)
In [6]: num
Out[6]: [244937, 132008, 278446, 613409, 799201]
In [8]: names = "hello the cruel world en".split()
In [9]: names
Out[9]: ['hello', 'the', 'cruel', 'world', 'en']
In [10]: rec = zip(names, num)
In [15]: data = pd.DataFrame(rec, columns = [u"姓名",u"业绩" ])
In [16]: data
Out[16]:
姓名 业绩
0 hello 244937
1 the 132008
2 cruel 278446
3 world 613409
4 en 799201
DataFrame方法函数的第一个参数是数据源,第二个参数columns是输出数据表的表头,或者说是表格的字段名。
导出数据csv
Windows平台上的编码问题,我们可以先做个简单处理,是ipython-notebook支持utf8.
import sys
reload(sys)
sys.setdefaultencoding("utf8")
接下来可以数据导出了。
In [31]: data
Out[31]:
姓名 业绩
0 hello 244937
1 the 132008
2 cruel 278446
3 world 613409
4 en 799201
#在ipython-note里后加问号可查帮助,q退出帮助
In [32]: data.to_csv?
In [33]: data.to_csv("c:\\out.csv", index = True, header = [u"雇员", u"销售业绩"])
将data导出到out.csv文件里,index参数是指是否有主索引,header如果不指定则是以data里columns为头,如果指定则是以后边列表里的字符串为表头,但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。
可到c盘用Notepad++打开out.csv看看。
简单的数据分析
In [43]: data
Out[43]:
姓名 业绩
0 hello 244937
1 the 132008
2 cruel 278446
3 world 613409
4 en 799201
python查询元祖的数据总数的符号是什么
Python 元组 count() 方法用于统计某个元素在元祖,列表,字符串中出现的次数。可选参数为在字符串搜索的开始与结束位置
MyList = [2,3,(1,2),5]
其中元素0,1和3是整数,而元素2是元组.我想创建一个计数器,告诉我在元组出现之前列表中有多少元素.
在这个例子中,我想要一个计数器,它将取值2(2个元素,2和3,在第一个元组之前).我尝试过以下方法:
counter = 0
while MyList[counter] is not tuple:
counter = counter + 1
但它不起作用,因为当它评估语句“(1,2)不是元组”而不是提高False时它继续取值True.知道问题可能是什么以及如何解决问题?谢谢.
解决方法:
您可以使用for循环并突破:
counter = 0
for elem in MyList:
if isinstance(elem, tuple):
break
counter += 1
或者,使用enumerate():
for counter, elem in enumerate(MyList):
if isinstance(elem, tuple):
break
# counter *could* be unbound if `MyList` is empty
from itertools import takewhile
counter = sum(1 for elem in takewhile(lambda e: not isinstance(e, tuple), MyList))
演示后一种方法:
from itertools import takewhile
MyList = [2,3,(1,2),5]
sum(1 for elem in takewhile(lambda e: not isinstance(e, tuple), MyList))
python 文件内容操作,如一个文件100万条数据,查询相同行数
使用open函数逐行读取文件,依次对比,如包含要求字符串,则数量累加1,读取完成后可统计出行数,代码如下:
n = 0
for line in open('filename','r'):
if '固定字符串' in line:
n += 1
print(n)
说明:
使用 for line in open这种方式可以提高代码效率,如需要更复杂统计,例如重复行,则可以使用hash函数,把行hash值存入列表,再做统计。
结语:以上就是首席CTO笔记为大家介绍的关于python查询共有多少数据的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。