perl脚本统计一列中重复

有一列数据，大概十几万行，如下格式：
41087
41088
41088
41089
41089
41090
41091
41091
……
现需要用Perl设计一脚本，统计出每行数据是否重复出现过，将统计结果放入其它文件。统计过后的格式如下：
41087，不重复
41088，重复
41088，重复
……
我用笨方法写了个算法，是双层的for循环，结果这效率……（遍历次数：十万乘十万，可怕），再求大虾们一有效率的算法。以便学习，多谢谢赐教。
我再举一返三的问一下：如果有两列数据，子列行数少，母列行数多，如果要求统计子列中的每一行是否在母列中出现过，这又该如何做才有效率？我的算法还是从子列中取出一行，去母列中遍历，结果效率又是子列行数乘以母列行数，又是天文数字。
再次拜谢。

举报该问题

推荐答案 2010-08-25

while($line=<>){
chomp $line;
if (not exist $results{$line}){
$results{$line} = 1;
}
else{
$results{$line}++;
}
}

foreach (keys %results){
if ($results{$_} == 1){
print $_."不重复\n";
}
else{
print $_."重复".$results{$_}."次\n";
}
}

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WXOWvWOv7.html

其他回答

第1个回答 2010-08-25

先排序

相似回答

这段sql我是放在perl脚本里执行的,但是batchno都是重复的,我想让他每...答：my $q = <<"QUERY";... where key_name='batchno';...QUERYfor my $incre ( 1..10000 ) { my $copy = $q; $copy =~ s/batchno/$incre/; $dbh -> do ( $copy )}

Perl脚本语言在MS中的应用答：通过Perl脚本，可以直接查看并调整设置参数，无需再次进入MS界面进行调整。在完成脚本编写后，点击“Run”进行计算。虽然Perl脚本的设置过程看似较直接操作更为繁琐，但当计算复杂或涉及多步骤时，使用脚本进行计算能显著提高效率。此外，Perl脚本还能够实现多种特定功能，如在MS中进行重复性计算、选择性固定原...

perl 脚本 | Materials Studio 动力学分析 (8)答：Perl脚本在Materials Studio动力学分析中的应用，特别是在计算高分子或长链烷烃的回转半径概率分布方面，可以按照以下步骤进行：目的说明：主要目标：研究高分子或长链烷烃的动力学性质，特别是通过回转半径这一指标来评估。回转半径的意义：定义：回转半径是衡量分子链尺寸的一个重要参数。概率分布与链柔性：回...

用perl 统计分析日志应用实战答：利用 Perl 进行日志分析的实战应用主要分为几个部分：日志提取关键信息、统计频率及处理优化。在日志分析中，我们可能需要提取特定的字段，例如订单号、客户号或设备号等。为了实现这个需求，Perl 提供了一种简单且强大的方法。首先，我们需要编写一个 Perl 脚本，如 `log-analyse.pl`。该脚本主要包含几个...

for in循环语句批量重命名的问题;bash答：下面这个脚本的用法 ./rename.sh 目标目录结果是自动将目标目录中所有的*.jpg文件重命名为prefix*.png文件但文件很多时速度很慢。awk一行的用途是计算文件名中'.'的个数供cut删除最后一个后缀。!/bin/bash pushd $1 for name in $(ls |grep '\.jpg$')do dots=$(echo $name|awk -v RS...

EXCEL按要求统计重复数据的次数答：用countif 比如,商品列表为A1到A100 B1为物品, C1为数量 B2为肥皂 C2为: =COUNTIF(A1:A100,B2)下边类推

Perl程序怎么用答：在终端中，通过./foo.pl命令运行你的Perl脚本。在Windows系统下：安装ActivePerl：下载并安装ActivePerl，它会自动配置所有必要的设置。安装PerlBuilder：安装PerlBuilder，这是一个集成开发环境，可以方便地编写、调试和运行Perl脚本。运行Perl脚本：在PerlBuilder中打开你的foo.pl脚本，并点击运行按钮，或者通过...

MS中perl脚本应用简介(二)答：直接运行按钮允许用户在当前界面上执行脚本，简单体系下此功能较为实用，但复杂体系可能因内存限制导致软件卡死。提交面板则提供了选择计算服务器、设置运行名称和计算核数的选项，对于需要GPU加速的forcite分子动力学计算尤其重要。perl脚本的结构和颜色分类如下：黑色代表perl定义，如变量定义和数据传递；红色...

Perl 文件读取计算字母数的题。(原题如图)?答：use Encode;name0="这个程序用于计算文件中每个不同字母的出现次数";name0=decode("cp936",$name0);name1="选择文件";name1=decode("cp936",$name1);my $file;my $mw = MainWindow->new();m1 = $mw->Frame(-background=>'green3')->pack(-side => 'bottom',-fill=>'both');m2...

大家正在搜

统计excel一列中重复的次数统计一列数据中重复的个数 excel统计不同列的重复值 excel如何统计一列的总数 excel统计一列有多少数据 excel统计一列有多少种类统计某列不重复数据的数量计算同一列重复数据数量 vba同列重复值统计个数