python列表去重方法

一位代码 2022-06-19 我要评论

前言

列表去重在python实际运用中，十分常见，也是最基础的重点知识。

以下总结了5种常见的列表去重方法

一、使用for循环实现列表去重

此方法去重后，原顺序保持不变。

# for循环实现列表去重
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
list2 = []
for l1 in list1:
    if l1 not in list2:
        list2.append(l1)
print(list2)

结果：[‘a’, ‘b’, 1, 3, 9]

二、使用列表推导式去重

此方法去重后，原顺序保持不变。

# 使用列表推导式去重
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
res = []
[res.append(i) for i in list1 if i not in res]
print(res)

结果：[‘a’, ‘b’, 1, 3, 9]

三、使用集合转换函数set()实现列表去重

原理：同一个集合的元素之间是不允许重复的

# set()列表去重
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
list2 = list(set(list1))
print(list2)

结果：[1, 3, 9, ‘b’, ‘a’]

问题：使用set()函数去重后，会自动排序，则原列表的顺序会发生改变

解决办法有2种：

第一种方法，使用sort()方法

# # 第一种方法，sort()
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
list2 = list(set(list1))
list2.sort(key=list1.index)
print(list2)

结果：[‘a’, ‘b’, 1, 3, 9]

注：sort()方法没有返回值，对列表元素进行原地排序

第二种方法，使用sorted()函数

# 第二种方法，sored()
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
list2 = sorted(list(set(list1)), key=list1.index)
print(list2)

结果：[‘a’, ‘b’, 1, 3, 9]

注：python内置函数sorted()函数返回新的列表，并不对原列表做任何修改

四、使用新建字典方式实现列表去重

原理：字典的"键"是不允许重复的

此方法去重后，原来顺序保持不变。

# 使用新建字典实现列表去重
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
dic = {}
dic = dic.fromkeys(list1).keys()
print(list(dic))

结果：[‘a’, ‘b’, 1, 3, 9]

五、删除列表中存在重复的数据

上面的4种去重方法，都是保留一个，删除其他

下面这种方法则是，只要存在重复，一个都不保留

# 删除存在重复的值，不保留
list1 = ['a', 'b', 1, 3, 9, 9, 'a']
list2 = [i for i in list1 if list1.count(i) == 1]
print(list2)

结果：[‘b’, 1, 3]

以上就是关于列表去重的5种方法，可以根据需求选择对应的方法。

附：Python 二维数组元素去重 np.unique()函数的使用

### 4.2 元素去重
# 4.2.1 一维数组去重
a = np.array([1, 2, 3, 4, 5, 5, 7, 3, 2, 2, 8, 8])
print('去重前：', a)
b = np.unique(a)
print('去重后：', b)
# 4.2.2 二维数组去重
c = np.array(((1, 2), (3, 4), (5, 6), (1, 3), (3, 4), (7, 6)))
print('去重前：', c)
# 方法一：利用set,set是无序不重复集合(推荐)
s = set() #创建空集合
for t in c:
    s.add(tuple(t)) #将数组转为元祖tuple，保证不被修改；再把元祖加入到集合中，完成去重
g = np.array(list(s)) # 将集合转换为列表，最后转为二维数组
print('去重后：', g)
# 合起来写
print('方法一去重后：', np.array(list(set(tuple(t) for t in c))))
# 方法二：转换为虚数
r, i = np.split(c, (1, ), axis=1)
print(r)
print(i)
x = r + i * 1j
# x = c[:, 0] + c[:, 1] * 1j
print('转换成虚数：', x) # 变成一维数组，可使用np.unique()
print('虚数去重后：', np.unique(x))
print(np.unique(x, return_index=True, return_counts=True))
# return_index=True表示返回另一个参数，这个参数也是一个数组，
# array([0, 3, 1, 2, 5]表示去重后的每个元素在去重前的数组中的位置/下标
# return_counts=True表示返回各元素出现的频次
idx = np.unique(x, return_index=True)[1]
# 第[1]列的数组正是return_index=True返回的内容：在c中的位置/下标
print('二维数组去重：\n', c[idx]) #提取这些下标所在的元素
# 结果：
# 去重前： [1 2 3 4 5 5 7 3 2 2 8 8]
# 去重后： [1 2 3 4 5 7 8]
# 去重前： [[1 2]
#  [3 4]
#  [5 6]
#  [1 3]
#  [3 4]
#  [7 6]]
# 去重后： [[1 2]
#  [1 3]
#  [5 6]
#  [7 6]
#  [3 4]]
# 方法一去重后： [[1 2]
#  [1 3]
#  [5 6]
#  [7 6]
#  [3 4]]
# [[1]
#  [3]
#  [5]
#  [1]
#  [3]
#  [7]]
# [[2]
#  [4]
#  [6]
#  [3]
#  [4]
#  [6]]
# 转换成虚数： [[1.+2.j]
#  [3.+4.j]
#  [5.+6.j]
#  [1.+3.j]
#  [3.+4.j]
#  [7.+6.j]]
# 虚数去重后： [1.+2.j 1.+3.j 3.+4.j 5.+6.j 7.+6.j]
# (array([1.+2.j, 1.+3.j, 3.+4.j, 5.+6.j, 7.+6.j]), array([0, 3, 1, 2, 5], dtype=int64), array([1, 1, 2, 1, 1], dtype=int64))
# 二维数组去重：
#  [[1 2]
#  [1 3]
#  [3 4]
#  [5 6]
#  [7 6]]

python列表去重方法

前言

一、使用for循环实现列表去重

二、使用列表推导式去重

三、使用集合转换函数set()实现列表去重

四、使用新建字典方式实现列表去重

五、删除列表中存在重复的数据

附：Python 二维数组元素去重 np.unique()函数的使用

总结

相关文章

猜您喜欢

今日热门