python打开一个txt文件以后如何将标点去掉，并将剩下的单词转换为小写以后变为单词列表；并统计词数

如题所述

举报该问题

推荐答案 2016-10-17

import re

f = open('word.txt','r')
word = f.read()
f.close()

# ------- 1 -------
wList1 = []
word1 = word.split(',')
for i in word1:
wList1.append(i.lower())
wLen1 = len(wList1)
print 'number of word:', wLen1, '\n', wList1

# ------- 2 -------
wList2 = []
word2 = re.findall('[a-zA-Z]+', word)
for i in word2:
wList2.append(i.lower())
wLen2 = len(wList2)
print '\nnumber of word:', wLen2, '\n', wList2

两种方法做的，如果单词之间的符号都一样，直接split('符号')就可以了，若是有不同的符号，就可以用第二种方法中的re库。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WBWeeOztej7BvOvOzet.html

相似回答

大家正在搜