python里如何快速统计 词频? 现在有个文件 data.txt 里面有1万多行 每行都

python里如何快速统计 词频?

现在有个文件 data.txt
里面有1万多行 每行都有数量不一的 数字:
2 76 8
111 65 6 36 9
.....

我现在统计的方法是 对于每个数 都遍历一遍所有数字,如果相等, count+1

这样太慢了 是N^2 时间

有快速的方法吗?

1. N^2时间复杂度是怎么算出来的?N指什么?
2. 对于多位数,比如 76,我们把它当做两个数字 7 和 6 这样来统计词频?追问

    数字通过   空格  æ¥åŒºåˆ†ã€‚  76连在一起,那就是一个词

     å› ä¸ºæˆ‘对于没个  è¯ï¼ˆæ•°å­—),  éƒ½æŠŠå®ƒå’Œæ•´ä¸ªæ•°æ®åº“的所有词 作对比,所以共N个词 * N词共N^2


优化方法我已经查出来了:

建立个dictionary , Key是词   Data是词频    é‚£æ ·åªç”¨æ‰«ææ•°æ®åº“1次  å°±å¯ä»¥ç»Ÿè®¡å‡ºæ‰€æœ‰è¯çš„词频

追答

恩,用dict是标准的解决方案。

温馨提示:答案为网友推荐,仅供参考
相似回答