python 下载纯英文书籍，计算出现的单词数和每个单词的次数，统书中使用频率最高最低的20单词？

python编程下载无版权纯英文文本文档书籍，去计算书中出现的单词总数，以及每个单词的次数，统计书中使用频率最高和最低的20个单词是什么？求大佬解答

举报该问题

推荐答案 2020-11-23

sentence = 'hello world nihao world hey hello java world hi python yeoman word'

#先把字符串分割成单个单词列表
list1 = sentence.split()
#['hello', 'world', 'nihao', 'world', 'hey', 'hello', 'java', 'world', 'hi', 'python', 'yeoman', 'word']
print list1

#把列表转为结合，为了去除重复的项
set1 = set(list1)
#set(['java', 'python', 'word', 'nihao', 'hey', 'yeoman', 'hi', 'world', 'hello'])
print set1

#把集合转为列表，集合元素没有顺序，没有索引属性，而列表有
list2 = list(set1)
#['java', 'python', 'word', 'nihao', 'hey', 'yeoman', 'hi', 'world', 'hello']
print list2

#新建一个空的字典
dir1 = {}

for x in range(len(list2)):
dir1[list2[x]] = 0 #字典值初始为0
for y in range(len(list1)):
if list2[x] == list1[y]:
dir1[list2[x]] += 1

#{'word': 1, 'python': 1, 'nihao': 1, 'hey': 1, 'hello': 2, 'hi': 1, 'world': 3, 'java': 1, 'yeoman': 1}
print dir1

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WWWO7etjt7zWeWOOBXj.html

第1个回答 2020-11-23

fhv the one that has been published by my phone and I'm not going on with my friends with me

第2个回答 2020-11-24

可以用collections库中的Counter进行统计。

from collections import Counter

txt='hello world nihao world hey hello java world hi python yeoman word'

print('频率最高:',Counter(txt.split()).most_common(4))

print('频率最低:',sorted(Counter(txt.split()).most_common(),key=lambda x:x[1],reverse=False)[:4])

第3个回答 2020-11-23

是作业吧简单追问

对大佬能解答一下吗

追答

可以私信帮

第4个回答 2020-11-23

fhv the one that has been published by my phone and I'm not going on with my friends with me

第5个回答 2020-11-24

可以用collections库中的Counter进行统计。

from collections import Counter

txt='hello world nihao world hey hello java world hi python yeoman word'

print('频率最高:',Counter(txt.split()).most_common(4))

print('频率最低:',sorted(Counter(txt.split()).most_common(),key=lambda x:x[1],reverse=False)[:4])

第6个回答 2020-11-23

是作业吧简单追问

对大佬能解答一下吗

追答

可以私信帮

相似回答

python自然语言处理有没有新的版本答：解答:简奥斯丁的小说 Persuasion 总共包含 98171 字和 6141 个唯一单词。此外,最常见的词例是逗号,接着是单词the。事实上,这个任务最后一部分是最有趣的经验观察之一,完美说明了单词的出现现象。如果你对海量的语料库进行统计,将每个单词的出现次数和单词出现的频率由高到低记录在表中,我们可以直观地发现列表中词频...

26个英文字母中,单词组合应用频率最高的10个是什么?答：大家对该丛书《LOVEORMON�EY》部分进行统计，计算26个字母的出现频率，然后制成图表。从收集的数据比较中得出结论，出现频率较高的9个英文字母分别是：A、E、H、I、N、O、R、S、T，出现频率较低的8个字母分别是：B、F、J、K、Q、V、X、Z。通过打字实验，他们发现出现频率较高的字母并...

记忆单词的方法是什么答：记忆单词的方法：1.由音及形法。即弄清这个单词中的字母或字母组合的发音,根据读音写出相应的字母及字母组合.这样既可以使我们准确发音,又能较容易地记住单词拼写.2.分类法。把学过的单词按其属性分门别类串在一起记。例如季节：spring 、summer 、autumn 、winter学科：English、maths、physics histo...

在普通心理学书中影响遗忘的因素有哪些?答：在普通心理学书中,影响遗忘的主要因素包括:1. 时间间隔。时间间隔越长,遗忘的可能性越大。这是因为随着时间的推移,记忆痕迹会逐渐衰减和消失。2. 补习次数。多重复练习可以弥补记忆中的遗忘,增加记忆的强度和持久性。如果某些信息只学习或使用一次,比较容易被遗忘。3. 遗忘曲线。遗忘大部分发生在初期,...

请推荐西部片(200高分) 经典不经典的都要。请推荐吧。谁最多,给...答：请推荐西部片(200高分) 经典不经典的都要。请推荐吧。谁最多,给谁分【欧美一百部经典电影】1、《教父》The Godfather 1972年 8.9 科波拉黑帮经典《教父》的首部,派拉蒙公司最成功的影片之一,坐稳IMDB头把交

怎样开发右脑答：1．左手写字。细心的观众或许会发现很多外国影片中老外在讲课时经常能使用的是左手写板书，有的明星签名也是用的左手，这样看来，我们也要练一练左手啦。左手写字可分为两个方面。一方面我们用左手从左向右写字，就是争取用左手代替右手功能。另一方面，就是用左手从右向左写镜像字，即写完后在左边立一...

大家正在搜

python常用的一千多个单词 python书籍pdf下载最好的python入门书籍 python进阶书籍的推荐 python常用单词 python需要记的单词 python英语单词库 7本Python必读的入门书籍 python编程书籍推荐