python里如何快速统计 词频?
现在有个文件 data.txt
里面有1万多行 每行都有数量不一的 数字:
2 76 8
111 65 6 36 9
.....
我现在统计的方法是 对于每个数 都遍历一遍所有数字,如果相等, count+1
这样太慢了 是N^2 时间
有快速的方法吗?
æ°åéè¿ ç©ºæ ¼ æ¥åºåã 76è¿å¨ä¸èµ·ï¼é£å°±æ¯ä¸ä¸ªè¯
å 为æ对äºæ²¡ä¸ª è¯ï¼æ°åï¼ï¼ é½æå®åæ´ä¸ªæ°æ®åºçææè¯ ä½å¯¹æ¯ï¼æä»¥å ±Nä¸ªè¯ * Nè¯å ±N^2
ä¼åæ¹æ³æå·²ç»æ¥åºæ¥äºï¼
建ç«ä¸ªdictionary ï¼ Keyæ¯è¯ Dataæ¯è¯é¢ é£æ ·åªç¨æ«ææ°æ®åº1次 å°±å¯ä»¥ç»è®¡åºææè¯çè¯é¢
追çæ©ï¼ç¨dictæ¯æ åç解å³æ¹æ¡ã