文件夹内有许多个这样的txt文件全都是类似的卡号信息 ( 中间不是空格是tab),要怎么把所有人卡号信息筛选出来且不能重复 (单个文件有好几千行!),卡号都是10位数,有部分不是10位的前面还要帮忙加上0,我用python怎么搞?
把所有的这些txt文件放到一个文件夹里
打开cmd, 进入到这个放了多个txt的文件夹, 运行命令copy *.txt all.txt
在该文件夹下创建一个python脚本 1.py, 将下列代码复制进去
4. 运行该脚本, 然后该文件夹下就会多出一个result.txt的文件, 里面放的就是去重完之后的所有卡信息.
追问我把改成 for i in range(len(result)/2+1): 解决了! 谢谢
flists=[r'C:\Users\CC\Desktop\card\all.txt'] 我路径前面+r的 就成这样了
这样的输出符合程序的原始预期。不知有什么疑问?
追问大哥 你看我图片 名字前面那么多000 还没换行
光要卡号的话简单。假设源文件名为1.txt,卡号输出到2.txt
with open('1.txt','r') as f: