python里如何快速统计词频？现在有个文件 data.txt 里面有1万多行每行都

python里如何快速统计词频？

现在有个文件 data.txt
里面有1万多行每行都有数量不一的数字：
2 76 8
111 65 6 36 9
.....

我现在统计的方法是对于每个数都遍历一遍所有数字，如果相等， count+1

这样太慢了是N^2 时间

有快速的方法吗？

举报该问题

推荐答案 2015-10-21

1. N^2æ¶é´å¤æåº¦æ¯æä¹ç®åºæ¥çï¼Næä»ä¹ï¼
2. å¯¹äºå¤ä½æ°ï¼æ¯å¦ 76ï¼æä»¬æå®å½åä¸¤ä¸ªæ°å 7 å 6 è¿æ ·æ¥ç»è®¡è¯é¢ï¼è¿½é®

æ°åéè¿ ç©ºæ ¼ æ¥åºåã 76è¿å¨ä¸èµ·ï¼é£å°±æ¯ä¸ä¸ªè¯

å ä¸ºæå¯¹äºæ²¡ä¸ª è¯ï¼æ°åï¼ï¼ é½æå®åæ´ä¸ªæ°æ®åºçææè¯ ä½å¯¹æ¯ï¼æä»¥å±Nä¸ªè¯ * Nè¯å±N^2

ä¼åæ¹æ³æå·²ç»æ¥åºæ¥äºï¼

å»ºç«ä¸ªdictionary ï¼ Keyæ¯è¯ Dataæ¯è¯é¢ é£æ ·åªç¨æ«ææ°æ®åº1æ¬¡ å°±å¯ä»¥ç»è®¡åºææè¯çè¯é¢

è¿½ç

æ©ï¼ç¨dictæ¯æ åçè§£å³æ¹æ¡ã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WOzvztW77vteXtBOWOt.html

相似回答

如何用python统计一个txt文件中各个单词出现的次数答：1、首先，定义一个变量，保存要统计的英文文章。2、接着，定义两个数组，保存文章中的单词，以及各单词的词频。3、从文章中分割出所有的单词，保存在数组中。4、然后，计算文章中单词的总数，保存在变量中。5、用for循环，统计文章中各单词的词频。6、最后，输出文章中各单词的词频。7、运行程序，电...

用Python统计词频答：astr.replace("\n", "")slist = list(astr.split("\t"))alist = [][alist.append(i) for i in slist if i not in alist]alist[-1] = alist[-1].replace("\n", "")return alist if __name__ == "__main__":code_doc = {} with open("test_data.txt", "r", ...

如何利用python实现词频图?答：可以加载自定义词典，格式与`dict.txt`（jieba库安装时自带的词典）相同，一个词占一行，每行分三部分。更改分词器的`tmp_dir`和`cache_file`属性，可以指定缓存文件所在的文件夹和文件名，用于受限的文件系统。加载自定义词典示例和动态修改词典的`add_word`、`del_word`方法。词性标注示例如下：我 ...

一个txt文档,已经用结巴分词分完词,怎么用python工具对这个分完词的文 ...答：/usr/bin/env python3#-*- coding:utf-8 -*-import os,random#假设要读取文件名为aa，位于当前路径filename='aa.txt'dirname=os.getcwd()f_n=os.path.join(dirname,filename)#注释掉的程序段，用于测试脚本，它生成20行数据，每行有1-20随机个数字，每个数字随机1-20'''test=''for i in...

你好想用Python做一个英文单词词频统计软件,将当前目录下的所有txt文 ...答：!/usr/bin/env python dic={} for i in open('data.txt'):array=[]i=i.strip()array=i.split()for j in array:if not dic.has_key(j):dic[j]=0 dic[j]+=1 for i in dic.keys():print i,dic[i]

一个基于Python3的神奇插件——you-get答：现在，让我们来了解一下you-get插件的主要功能。只需在命令行窗口输入以下指令即可实现下载目标文件：只需将对应的url地址放置在you-get后，所下载的文件将默认保存在指定位置。当然，我们也可以自定义文件保存路径和文件名，具体指令如下：请注意，所有命令都是在命令行窗口执行的，而非在Python中。接下来...

python 字典中的词频统计之后如何将频数大于一个数字的词的数量统计...答：count = 0for key,value in dic.items( ): if value > 14: count += 1print count

python问题,我运用python做中文词频分析的时候总是显示UnicodeDecodeError...答：出现原因：文件不是 UTF8 编码的，而系统默认采用 UTF8 解码。解决方法是改为对应的解码方式。解决办法：“文件–》另存为”，可以看到文件的默认编码格式为ANSI，改为编码格式UTF8，保存

python自然语言处理有没有新的版本答：任何模块都能利用 Python 的标准结构 from . . . import . . . 来导入顶层的命名空间。 3.3 任务 1 : 探索语料库上文提到,NLTK 含有多个 NLP 语料库。我们把这个任务制定为探索其中某个语料库。任务:用 NLTK 的 corpus 模块读取包含在古登堡语料库的 austen-persuasion.txt,回答以下问题: 这个语料库一...

大家正在搜

python词频统计找不到文件 python中文词频统计 python文本词频统计 python分词统计词频 python英文词频统计 python词频统计怎么做 python词频统计方法 python词频统计代码 python词频统计代码分析

python统计一个大文件中很多小文件里面的词频

Python 如何从txt文件中统计出多个大量的重复的数据？...

如何用python统计一个txt文件中某个单词出现的次数

请问一下Python里面在导入了txt文件之后如何统计每一串...

python 统计一个txt文档有多少行

python如何统计所有文本文件的行数

python统计文本中有多少行

Python如何从一个txt文件中挑出所有带有‘asd’的行...