若DataFrame对象df中存在重复数据,以下说法正确的是( )。
A: 执行df. drop_duplicates()语句,将真正删除df中原有的重复数据
B: 使用df. drop_duplicates()方法仅可以删除重复的行数据
C: 使用df. drop_duplicates()方法将删除所有重复的数据
D: 使用df. drop_duplicates()方法可以删除指定列的全部重复数据
A: 执行df. drop_duplicates()语句,将真正删除df中原有的重复数据
B: 使用df. drop_duplicates()方法仅可以删除重复的行数据
C: 使用df. drop_duplicates()方法将删除所有重复的数据
D: 使用df. drop_duplicates()方法可以删除指定列的全部重复数据
举一反三
- 在 Pandas中,drop_duplicates()提供了删除重复值的功能,这个方法主要帮助我们删除后出现的重复值。例如,某列数据如下:Open: Open1 12 A: df[‘open’].drop_first() B: df[‘open].drop_duplicates(keep=’first’) C: df[‘open’].drop_duplicates(keep=’last’) D: df[‘open’].drop_last()
- DataFrame 的duplicates 方法可以用来删除重复数据。
- 扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来删除重复的数据。
- 语句df.drop([‘SalePrice’],axis=1,inplace=True)中的drop()函数表示从数据集中删除数据,下面描述不正确的是 ( ) A: drop()函数只能删除列 B: drop()函数可以删除行 C: drop()函数可以一次删除多列或多行 D: 参数inplace=True,表示直接在数据集df上删除
- 将二维数组df中重复行直接删除的命令是( A: df.drop_duplicates() B: df[df.drop_duplicates()] C: df.duplicated() D: df[df.duplicated()]