识别并删除R中的重复数据

如题所述

第1个回答 2022-06-30

本教程介绍如何识别和删除R中的重复数据。

您将学习如何使用以下R base和dplyr函数：

1）R基础函数

duplicated（）：用于标识重复的元素和

unique（）：用于提取唯一元素，

2）distinct（） [dplyr package]删除数据框中的重复行。

必需的包

演示数据集

查找并删除重复元素

提取独特元素

删除数据框中的重复行

总结

需要的包

示例数据集

我们将使用R内置的iris数据集，首先将其转换为tibble数据帧(tbl_df)，以便于进行数据分析。

查找并删除重复的元素

R函数 duplicate() 返回一个逻辑向量，其中TRUE指定向量或数据帧的哪些元素是重复的。

创建如下向量:

要查找x中重复元素的位置，请使用以下命令:

## [1] FALSE TRUE FALSE FALSE TRUE FALSE

提取重复元素:

## [1] 1 4

如果您想删除重复的元素，请使用 !duplicate() ，!意思是逻辑否定:

## [1] 1 4 5 6

按照这种方法，可以根据列值从数据框中删除重复的行，如下所示

提取非重复的元素

## [1] 1 4 5 6

也可以在数据框上应用unique()，以删除重复的行，如下所示:

删除数据帧中的重复行

distinct() [dplyr包]函数可用于仅保留数据帧中的唯一/不同行。如果有重复的行，则只保留第一行。它是R基函数unique()的变形。

基于所有列，删除重复行

基于某些列(变量)，删除重复的行:

参数 .kep_all用于保存数据中的所有变量。

在本章中，我们描述了识别和删除重复数据的重要函数：

基于一个或多个列值删除重复行：my_data%>%dplyr::distinct（Sepal.Length）

从向量和数据框中提取唯一元素的R基函数：unique（my_data）

确定重复元素的R基函数：duplicate（my_data）

相似回答

【R去重】保留第一个重复/去所有的重复答：在R中识别和删除重复数据：主要运用 dplyr::n()do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项，后者不包含重复的第一项。duplicate()命令在开发版的do包中，CRAN上的do包并不包含这一命令。安装方法是devtools:install_github("yikeshu0611/do")去掉所有重复最简洁函数：...

R语言中如何去除重复数据答：那你就先把所有的字符串都变成小写，再用duplicated比较就好了 x<-c("Anne","anne","bkk")y<-tolower(x)duplicated(y)

文件管理批量删除方法:如何自动筛选重复文件并删除的步骤详解答：在任务选项中，明确你的需求。如果对数据安全有所顾虑，建议先备份。选定"批量删除文件"任务，然后确认无误后，点击"添加本任务"，你的决定即将被执行。步骤四：启动清理过程任务列表中，你的设置清晰可见。当一切准备就绪，点击"开始执行"，等待时间仿佛凝固在这一刻。成果呈现：高效自动化短短几秒后...

excel去除重复的数据三种办法答：该去重逻辑是默认保留第一行，并自动删除后续重复值。2.第二种去重方法框选A到C列，在工具栏中单击[数据]，单击菜单栏【排序和筛选】中“高级“按钮，在方式选项中单击”将筛选结果复制到其他位置“，复制到(T)中选中E到G列，再单击”选择不重复的记录(R)“，最后单击”确定“按钮，即可去除重复。

excel怎么查找重复项答：在Excel中查找重复项，您可以使用“条件格式”功能或“删除重复项”功能。以下是具体的操作方法：使用条件格式查找重复项 1. 选择数据范围：首先，打开您的Excel表格，并选中您想要查找重复项的数据范围。2. 应用条件格式：在Excel的“开始”选项卡中，找到“条件格式...

怎么筛选重复2次或者3次以上的数值呢?答：那么，这列里等于2的表示重复2次，等于3的表示重复3次，等n的表示重复3次以上，0的话是不重复。然后再根据这列的结果进行筛选，就可以得到你要想要的结果了。2、程序法，可以根据你的需要写个VBA小程序，就是逐行读出来进行判断，然后根据判断的结果来对数据进行处理。3、其它方法。将数据导入数据库...

怎么批量删除文件夹里的重复文件答：F盘后点击第二个红圈中的箭头，就把E、F盘作为扫描重复文件的路径。4、点击立即扫描，重复文件以列表的形式出现 5、在左边选择助手中，有诸多规则可以选择。建议选中“标记所有组别以及文件夹相同的项目并保留一份”、“每组中最旧的文件”，点击文件删除，即可保留最新的文件（重复的旧文件被删除）。

r语言清除上一次运行的数据答：清除工作空间、关闭并重新打开R、清除特定的对象等。1、删除当前工作空间中的所有对象。ls（）函数返回当前工作空间中的所有对象，rm（）函数则删除这些对象。2、关闭当前的R会话并重新打开一个新的会话。这样，之前的数据都会被清除。3、可以直接使用rm（）函数并指定对象的名称。

Wps表格怎么筛选出重复数据并且删除重复数据答：所以只有一个选择），选择好后点击“删除重复项（R）”按照上一步操作后，又会出现一个弹窗，主要是做提示的，会告诉发现了多少重复项，已经删除，剩下多少个数值，这就是excel的强大，在你还没想到的地方它已经给你展现出来了按照前面的操作完成后就可以看到表格中已经删除了重复的数据 ...

大家正在搜

excel识别重复数据如何查找一列数据中的重复项 R中的RDA数据表格里重复的数据怎么找出来 excel怎么找到重复的数据 R中自带的数据如何调用怎么选出重复数据如何快速提取重复数据表格重复数据