栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python一些可能用的到的函数系列78 计算PSI

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python一些可能用的到的函数系列78 计算PSI

说明

PSI用于度量两个分布之间的差异,主要用于检查客群的变化/模型的稳定性。本质上也就是某种交叉熵。

内容

以这个帖子中的数据为例,贡献两个小函数

函数1
# 将一列转为百分比
import numpy as np 
def transform_list2pct(some_list):
    arr1 = np.array(some_list)
    return arr1 / arr1.sum()

函数2
# 计算两次分布的PSI (<0.1 ok, <0.25 review, else update)
import numpy as np 
def kpi_psi_2list(a_list , b_list):
    arr_a = np.array(a_list)
    arr_b = np.array(b_list)
    tem_res = (arr_a-arr_b)*np.log(arr_a/arr_b)
    return tem_res.sum()
使用

使用例子的数据计算(本身已经归一化了,函数支持输入原始的频数统计)

kpi_psi_2list([0.7233,0.1133,0.0367,0.0200,0.1067], [0.5514,0.0986,0.0743,0.0600,0.2157])
0.19587683021838628
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/360491.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号