计算字符串中字符出现次数的最简单方法是什么?

例如计算'a''Mary had a little lamb'中出现的次数

#1 楼


str.count(sub [,start [,end]])
返回范围为sub的子字符串[start, end]的不重叠出现次数。可选参数startend被解释为切片符号。

>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4


#2 楼

您可以使用count():

>>> 'Mary had a little lamb'.count('a')
4


#3 楼

正如其他答案所说,使用字符串方法count()可能是最简单的方法,但是如果您经常这样做,请查看collections.Counter:

from collections import Counter
my_str = "Mary had a little lamb"
counter = Counter(my_str)
print counter['a']


评论


为什么经常使用会更好呢?有什么好处?

–麻烦
2015年2月10日在22:36

如果要给定字符串中很多字母的计数,Counter会以更简洁的形式提供所有字母。如果要从许多不同的字符串中对一个字母计数,Counter不会带来任何好处。

–布伦登·布朗(Brenden Brown)
2015年2月17日19:30在

对于这个特定的实例,计数字符,我更喜欢collections.counter。为了查找特定子字符串的实例,我将使用正则表达式或str.count()方法。我还没有测试过,但是由于计算所有字符并追加到字典而不是计算单个子字符串的出现会产生一些开销,因此可能会有性能差异。我建议编写一个脚本以生成一个很长的文件以进行搜索,然后定时执行每种方法。

–丹尼尔·B。
15年7月20日在17:58

经常使用的好处是Counter可以一次计算所有计数,这几乎与一次执行myst​​ring.count('a')一样快。因此,如果执行此操作20次,则可能节省了10倍的计算时间。计数器也可以告诉您项目是否在字符串中:例如,如果计数器中为“ a”:

– BAMF4bacon
16年5月31日在14:32



#4 楼

可能是正则表达式吗?

import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))


评论


一个很好的主意,但在这种情况下过大了。字符串方法'count'可以做同样的事情,但可以立即清楚地知道它在做什么。

– nilamo
09年7月20日在20:18

为什么负利率,也许有人需要类似的代码来做类似的事情。我投票

– kiltek
2012年3月31日上午10:18

这应该被否决,因为这是对字符串中的字符进行计数的最无效的方法。如问题所示,如果目标只是简单地计算字符,将很难找到更差的方法来完成这项工作。在内存和处理器开销方面,绝对必须避免这种解决方案。没有人会“需要”使用这种方法来查找字符串中的字符数。

–克里斯托弗(Christopher)
13-10-21在18:04



字符串方法不可用时的好解决方案:len(re.findall('1',bin(10)))

– Conor
16年6月23日在8:48

#5 楼

myString.count('a');


更多信息在这里

#6 楼

str.count(a)是计算字符串中单个字符的最佳解决方案。但是,如果您需要计算更多的字符,则必须读取整个字符串与要计算的字符一样多。

这项工作的更好方法是:

from collections import defaultdict

text = 'Mary had a little lamb'
chars = defaultdict(int)

for char in text:
    chars[char] += 1


因此,您将拥有一个dict,它返回字符串中每个字母的出现次数,如果不存在则返回0

>>>chars['a']
4
>>>chars['x']
0



对于不区分大小写的计数器,可以通过子类化defaultdict(基类为只读)来覆盖mutator和accessor方法:

class CICounter(defaultdict):
    def __getitem__(self, k):
        return super().__getitem__(k.lower())

    def __setitem__(self, k, v):
        super().__setitem__(k.lower(), v)


chars = CICounter(int)

for char in text:
    chars[char] += 1

>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0


评论


您基本上是在重新实现Counter,Counter已经是集合中的一个类。

– Merv
17-10-30在21:29

@merv不是。 Counter是一个更肿的纯Python类,defaultdict的__missing__用C编写。对于像这样的简单任务(int也用C实现),这种方法要快得多。

–努诺·安德烈(NunoAndré)
17年9月9日在10:42

同样,np.unique(sample,return_counts = True)可能会有用。

– TopCoder2000
11月30日11:47

#7 楼

Python-3.x:

"aabc".count("a")



str.count(sub [,start [,end]])

返回子字符串sub在[start,end]范围内不重叠发生的次数。可选参数start和end的解释方式为切片符号。


#8 楼

这个简单而直接的功能可能会有所帮助:

def check_freq(x):
    freq = {}
    for c in x:
       freq[c] = str.count(c)
    return freq

check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}


评论


您正在隐藏str。如果将其名称赋予变量,则str不再是内置类型。同样,您正在计数十四次b的十四次。您可以通过在set(text)中将for更改为text中的c来避免这种情况。

–努诺·安德烈(NunoAndré)
19 Mar 17 '19 at 21:47

#9 楼

如果希望不区分大小写(当然还有正则表达式的全部功能),则正则表达式非常有用。

my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m")   # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))


请注意,正则表达式的版本顺序为运行时间是原来的十倍,仅当my_string非常长或代码在深循环内时,这才可能是一个问题。

评论


如果您只是想解决大小写敏感问题,那么正则表达式就显得过于矫kill过正。 my_sting.lower()。count('m')性能更高,更清晰,更简洁。

–食人魔代码
16年8月17日在5:31

#10 楼

a = 'have a nice day'
symbol = 'abcdefghijklmnopqrstuvwxyz'
for key in symbol:
    print key, a.count(key)


#11 楼

str = "count a character occurance"

List = list(str)
print (List)
Uniq = set(List)
print (Uniq)

for key in Uniq:
    print (key, str.count(key))


#12 楼

不使用Counter()count和regex来获取所有字符计数的另一种方法

counts_dict = {}
for c in list(sentence):
  if c not in counts_dict:
    counts_dict[c] = 0
  counts_dict[c] += 1

for key, value in counts_dict.items():
    print(key, value)


#13 楼

count绝对是计算字符串中字符出现次数的最简洁,最有效的方法,但我尝试使用lambda提出解决方案,如下所示:

sentence = 'Mary had a little lamb'
sum(map(lambda x : 1 if 'a' in x else 0, sentence))


这将导致:

4


此外,如果句子是包含与上述相同字符的子字符串列表,则还有另一个好处,然后由于使用in,这也给出了正确的结果。看看:

sentence = ['M', 'ar', 'y', 'had', 'a', 'little', 'l', 'am', 'b']
sum(map(lambda x : 1 if 'a' in x else 0, sentence))


这也会导致:

4


但是当然可以仅在这种情况下,当检查单个字符(例如'a')的出现时。

#14 楼

“不使用计数来查找字符串中想要的字符”方法。

import re

def count(s, ch):

   pass

def main():

   s = raw_input ("Enter strings what you like, for example, 'welcome': ")  

   ch = raw_input ("Enter you want count characters, but best result to find one character: " )

   print ( len (re.findall ( ch, s ) ) )

main()


评论


为什么要使用空计数功能?为什么要使用main()函数?为什么到处都是丑陋的空间?这不是一个好答案。

–bugmenot123
17年8月9日在8:04

#15 楼

我是pandas库的爱好者,尤其是value_counts()方法。您可以使用它来计数字符串中每个字符的出现:

>>> import pandas as pd
>>> phrase = "I love the pandas library and its `value_counts()` method"
>>> pd.Series(list(phrase)).value_counts()
     8
a    5
e    4
t    4
o    3
n    3
s    3
d    3
l    3
u    2
i    2
r    2
v    2
`    2
h    2
p    1
b    1
I    1
m    1
(    1
y    1
_    1
)    1
c    1
dtype: int64


#16 楼

我不了解“最简单”,但是简单的理解就可以:
>>> my_string = "Mary had a little lamb"
>>> sum(char == 'a' for char in my_string)
4

利用内置和,生成器理解和bool是整数的子类的事实:字符如何等于'a'。

#17 楼

a = "I walked today,"
c=['d','e','f']
count=0
for i in a:
    if str(i) in c:
        count+=1

print(count)


评论


这不会区分d,e,f的计数。

– Gino Mempin
9月29日4:30

@GinoMempin,您好:您的意图不是要区分,但是您可以声明其他两个变量,如果愿意,可以将i分别与“ d”,“ e”和“ f”进行比较。

– Kquek
9月29日晚上8:11

#18 楼

spam = 'have a nice day'
var = 'd'


def count(spam, var):
    found = 0
    for key in spam:
        if key == var:
            found += 1
    return found
count(spam, var)
print 'count %s is: %s ' %(var, count(spam, var))


#19 楼


Python 3


有两种方法可以实现此目的:

1)内置函数count()

sentence = 'Mary had a little lamb'
print(sentence.count('a'))`


2)不使用函数

sentence = 'Mary had a little lamb'    
count = 0

for i in sentence:
    if i == "a":
        count = count + 1

print(count)


#20 楼

仅此恕我直言-您可以添加上部或下部方法

def count_letter_in_str(string,letter):
    return string.count(letter)