栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

数据分析之获取前N最大、最小值或索引

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

数据分析之获取前N最大、最小值或索引

首先,为了获取前N的最大最小值或者索引,下面介绍了两种方法,大家可以视情况选择:

1、利用heapq模块,heapq模块中有两个函数:

  • nlargest()
  • nsmallest()

他们可以找到列表,元组,集合等数据结构中的最大或最小的n个元素,并以列表的形式返回。
此方法只适用于数组无序且没有重复元素;否则,会出现键值匹配混乱。

2、利用pandas模块排序

  • sort_values(), 默认从小到大
  • sort_values(ascending = False),从大到小排序
1. 获取数组前 N 最大(小)值
a = [1, 4, 6, 8, 9, 3, 2, 5, 7, 8, 4]

# 1、利用heapq模块
rel2 = heapq.nlargest(4, a)
print(rel2)

# 2、利用pandas模块
b = pd.Series(a).sort_values(ascending = False)[:4]
print(b)
输出:
[9, 8, 8, 7]
4    9
3    8
9    8
8    7
dtype: int64
2. 获取数组前 N 最大(小)值索引
a = [1, 4, 6, 8, 9, 3, 2, 5, 7, 8, 4]

# 1、利用heapq模块
rel = map(a.index, heapq.nlargest(4, a))
index = list(rel)
print(index)

# 2、利用pandas模块
c = pd.Series(a).sort_values(ascending=False).index[:4]
print(c)
for i in range(len(c)):
    print(c[i])
输出:
[4, 3, 3, 8]
Int64Index([4, 3, 9, 8], dtype='int64')
4
3
9
8

注意: 虽然,利用heapq模块也得到了前 n 最大值的索引,但是因为数据重复,所以出现了索引值为【4,3,3,8】情况。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/357494.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号