python遍历txt对比去重

我有两个txt文档比较大大概有10m里面有很多行，我想对比这两个文件中相同的行并且删除第二个文件中相同的行而且第二个文件中是utf8编码这要怎么去实现呢请大家帮忙一下最近在学习拍森
# -*- coding: utf-8 -*-
#
# python 2.7

fp1 = file('', 'r')
fp2 = file('', 'r')
fp3 = file('', 'w')

d1 = {}
d2 = {}

isFirst = True

for line in fp1:
if not isFirst:
d1[hash(line)] = line
else:
isFirst = False

fp1.close()

isFirst = True
for line in fp2:
if not isFirst:
d2[hash(line)] = line
else:
isFirst = False

fp2.close()

diff = set(d1.keys()) - set(d2.keys())
for key in diff:
fp3.write(d1[key])
fp3.close()
这样子可以么顺序是不一样的呢

举报该问题

推荐答案 2015-03-02

å¦æåªæ10Mçè¯ï¼ä½ å¯ä»¥æä»ä»¬é½è¯»å°ååéï¼ä½¿ç¨pythonçsetè¿è¡å¯¹æ¯å é¤ï¼ ä¸è¿æä¸ä¸ªé®é¢å°±æ¯ï¼ä½ çåä¸ä¸ªæä»¶éä¼ä¸ä¼æå¤æ¡éå¤çæ°æ®ã

å¦æè§£å³äºæ¨çé®é¢è¯·éçº³ï¼
å¦ææªè§£å³è¯·ç»§ç»è¿½é®è¿½é®

åä¸ä¸ªæä»¶ç¡®å®ä¼ææå°æ°çéå¤æ°æ®çï¼ä¸æ¯å¾å¤ä½ç¡®å®æç

è¿½ç

æçä½ çéæ±æ¯ï¼å¯¹æ¯è¿ä¸¤ä¸ªæä»¶ä¸ç¸åçè¡å¹¶ä¸å é¤ç¬¬äºä¸ªæä»¶ä¸ç¸åçè¡

ä¹å°±æ¯è¯´å¦æä¸åè¡ï¼ä½æ¯åå®¹ä¸æ ·ï¼é£æ ·ä¹æ¯ä¸å é¤çï¼å¯¹ä¹ï¼

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/vWzOjeXeOXtWvtB777O.html

相似回答

大家正在搜

python比较txt文档中每行文本之间重复词的个数

python遍历字符串时是逐字遍历，遍历txt文本时是逐行读...

用python读取一个txt里的文件时，怎么去重复？

python 两个文本某字段比较，如果相同，返回其中一个文本...

python中实现两个txt文档的去重功能（即去掉第一个文档...

python 将文件内容去重，然后写出到txt

使用python遍历文件夹将文件夹中所有的txt文本转为ht...

Python如何循环读取txt文件的内容？