急求：如何用python删除文本中的重复行？

读取一个txt文本，文本每行一个词组（通常词组至少两个单词），删除文本中的重复行，输出。文本

如图所示。

举报该问题

推荐答案推荐于2017-06-13

1.如果你的txt 文件不大的话可以直接
tmp = open('**.txt').readlines() #把内容一次性全部读取出来是一个列表
set(tmp) #这个就是把列表去重复
然后你可以把这个去重后的tmp 写入到新的文件
2.txt很大，那么只能一行一行的读取去重了
#!/usr/bin/env python
# coding=utf-8
# python 2.7
outfile = open('result-readline.txt', 'w') #新的文件
list_1=[]
for line in open('test.txt'):  #老文件
    tmp = line.strip()
    if tmp not in list_1:
        list_1.append(tmp)
        outfile.write(line)
outfile.close()

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WBXBWtvtO7WBvzO7v7t.html

第1个回答 2015-01-26

发这种问题竟然是截图...没调试过，将就着看吧，主要意思就是通过set方法去除重复项

f = open(file, 'r')
ListOfLine = f.read().splitline()
ListOfLine = list(set(ListOfLine))
f.close()
f = open(file, 'w')
f.writelines(ListOfLine)
f.close()

追问

显示不正确

追答

那应该是因为读出来的是一个字符串，你用readline读入数组，然后set一下就行了

第2个回答 2015-01-26

你好：
一般是：
一边读文本文件，一边将行存入数组；
然后对读取的下一行数据，与数组中的数据做对比，
如果重复，就舍弃；；
最后就爱那个数组中的数据写入文件；本回答被网友采纳

相似回答

python删除data中完全重复的行答：在Python中，我们可以使用DataFrame的drop_duplicates方法来删除完全重复的行。在Python的pandas库中，有一个非常实用的方法叫做drop_duplicates，它能够帮助我们删除DataFrame中完全重复的行。这个方法会返回一个删除了重复行的新DataFrame，不会更改原来的DataFrame。默认情况下，它会考虑所有列，但也可以选择只...

Python 教学 | Pandas 缺失值与重复值的处理方法答：3. 重复值处理检测重复值：使用duplicated函数检测数据中的重复行。删除重复值：使用drop_duplicates函数删除重复行，保留唯一值：df.drop_duplicates。若要删除所有重复行，保留无重复的第一行或最后一行，可设置keep=False：df.drop_duplicates。

python如何去除重复行并写入另一个文件?答：要看重复行是连续的还是非连续的 如果是连续的，可以考虑缓存一行，然后把后面的行与缓存的行比较，如果不是，那就得缓存所有不同的行，每次读一行就要与所有缓存过的行做比较了，伪代码如下：coding=utf-8fin = open("input.txt", "r")fout = open("output.txt","a+")bufferedline =...

如何快速去除重复值答：python df = df.drop_duplicates # 基于所有列去除重复行 或者基于特定列去除重复行 df = df.drop_duplicates # 基于 'column_name' 列去除重复行这些方法都非常高效，适用于处理大量数据。如果你正在处理的数据量非常大，这些方法会比手动检查并删除重复值更快速且更准确。在实际应用中，选择哪种...

python如何合并多个txt文件删除所有重复行并生成新文件答：打开cmd, 进入到这个放了多个txt的文件夹, 运行命令copy *.txt all.txt 在该文件夹下创建一个python脚本 1.py, 将下列代码复制进去 coding=utf-8# using python27file_path = 'all.txt'with open(file_path, 'r') as f: card_informations = map(lambda x: x.strip().split('\t')...

删除data中完全重复的行,直接在原数据上删除答：python import pandas as pd data = { 'A': [1, 2, 2, 3, 4, 4, 4],'B': [5, 6, 6, 7, 8, 8, 9]} df = pd.DataFrame(data)使用drop_duplicates()函数删除重复的行：python df.drop_duplicates(inplace=True)这样，df中重复的行就会被删除。需要注意的是，inplace=True表示...

求助:如何用python脚本删除文本中的重复行(相同记录只保留一个)_百度...视频时间 00:35

Python--pandas删除操作答：Python的pandas库在数据清洗过程中扮演着重要角色，本文主要探讨其DataFrame中的一系列删除操作，包括行删除、列删除、处理缺失值和重复值。在这些操作中，inplace参数是一个关键，其默认为False，表示处理后的结果返回新数据框，若设置为True，将直接替换原有数据，返回None。首先，pandas的drop方法用于删除...

python比较txt文档中每行文本之间重复词的个数答：我们首先使用`open`函数打开文件并读取所有行，接着使用`readlines`函数获取所有行的内容。然后，利用`split`方法将每行文本分割成单词。为了去除重复的单词，可以将分割后的单词列表转换为集合。接下来，通过两个集合的交集操作，可以找出两个文本行中的共同单词。最后，利用`len`函数计算交集中单词的数量...

大家正在搜

python处理文本文件 python去除重复数据 python重复执行 pythonlist去重复 python文本解析 python写入文本 python文本分析和提取 python append python tuple

求助：如何用python脚本删除文本中的重复行（相同记录只保...

python去除文本中重复的字符串

急求：求助大神python两个TXT文本删除重复

python实现删除重复行并计数

python如何去除重复行并分别统计重复的行数？已有去除重复...

Python文件中如何除去重复行？前一行与后一行进行对比的...

python如何去除重复行并写入另一个文件

Python：如何从列表中删除重复项