在大熊猫DataFrame列中计算值的频率
问题描述:
我想计算每个值出现在数据框中的次数。
I want to count number of times each values is appearing in dataframe.
这是我的数据框 - df
:
Here is my dataframe - df
:
status
1 N
2 N
3 C
4 N
5 S
6 N
7 N
8 S
9 N
10 N
11 N
12 S
13 N
14 C
15 N
16 N
17 N
18 N
19 S
20 N
我想要计数的字典:
计数= {N:14,C:2,S:4}
c> df ['status'] ['N'] 但是它给出了 keyError
以及 df ['status' ] .value_counts
但没有用。
I have tried df['status']['N']
but it gives keyError
and also df['status'].value_counts
but no use.
答
您可以使用 value_counts
以及 to_dict
:
You can use value_counts
and to_dict
:
print df['status'].value_counts()
N 14
S 4
C 2
Name: status, dtype: int64
counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}