最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
如何在Python中利用NumPy的unique函数统计元素出现频率
时间:2026-06-24 08:46:46 编辑:袖梨 来源:一聚教程网
np.unique需加return_counts=True才能统计频率,因默认仅返回去重数组;开启后返回唯一值与对应频次两个对齐数组,二维时可指定axis按行/列统计。
直接用 np.unique 的 return_counts=True 参数,就能一步拿到唯一值和对应频次,不需要手动遍历或配合 collections.Counter。
为什么 np.unique 要加 return_counts=True 才能统计频率?
np.unique 默认只返回去重后的数组,不带任何计数信息。只有显式开启 return_counts=True,它才会额外返回一个同长度的整数数组,每个位置对应前一个返回值中对应元素的出现次数。
- 不加该参数 → 只返回
array([1, 2, 3]) - 加了 → 返回两个数组:
array([1, 2, 3])和array([3, 1, 2])
注意:两个返回值顺序严格对齐,counts[i] 就是 unique_vals[i] 的出现次数。
np.unique 统计频率时的常见错误现象
最常踩的坑是误以为返回的是字典或 (value, count) 元组列表,结果直接解包出错:
立即学习“Python免费学习笔记(深入)”;
values, counts = np.unique(arr) # ❌ 少写了 return_counts=True,counts 实际是 None
另一个典型问题是忽略默认排序行为——np.unique 总是按升序返回唯一值,如果你需要保持原始出现顺序,它做不到;此时得换 scipy.stats.mode 或手写逻辑。
- 输入
arr = [3, 1, 1, 2, 1]→ 返回values=[1,2,3],不是[3,1,2] - 想按首次出现顺序?不行,这不是
np.unique的设计目标
二维数组怎么用 np.unique 统计频率?
默认展平统计(axis=None),但你可以指定 axis=0 或 axis=1 沿某维度找“唯一行”或“唯一列”,此时 return_counts=True 依然有效,只是返回的 counts 对应的是该维度上的重复次数。
-
np.unique(arr_2d, axis=0, return_counts=True)→ 统计重复的行 -
np.unique(arr_2d, axis=1, return_counts=True)→ 统计重复的列 - 注意:此时
counts是一维数组,长度等于该轴上唯一切片的数量
示例:
arr = np.array([[1,2], [3,4], [1,2]])<br>vals, cnts = np.unique(arr, axis=0, return_counts=True)<br># vals = array([[1, 2], [3, 4]]), cnts = array([2, 1])
多维场景下容易忽略 axis 参数的语义,误以为它能按元素逐个统计——其实只要用了 axis,就不再是标量元素统计,而是子数组级别的唯一性判断。
相关文章
- Debian Syslog和入侵检测系统 07-03
- Linux readdir怎样实现文件加密 07-03
- 怎样用Linux strings检查软件漏洞 07-03
- 《王者荣耀世界》废物利用操作方法 07-03
- debian分卷怎样实现数据加密 07-03
- Debian telnet服务安全漏洞防范措施 07-03