python绘制螺旋曲线,python坐标点连线
Python金融风控记分卡模型与数据分析微专业课(博主亲自录制视频):http://dwz.date/b9vv
医学统计项目可以联系。
QQ:231469242
洛伦茨曲线也叫晋升图或收入曲线。
提升图主要通过随机选取对比模型来表示。
绿色曲线比黄色曲线更不平衡。
基尼系数=A/(A B)
b是半个正方形的恒定面积,A区间的面积越大,基尼系数越大。
升降机、升降机台和升降机图表
电梯指数、电梯表和电梯图
1.什么是Lift?
I) Lift(提升指数)是评价预测模型是否有效的度量;该比率是根据使用和不使用该模型获得的结果计算得出的。
II)一个简单的数字示例:
I .假设您想要向选定的1000个人发送一份问卷。以往的经验告诉你,大概有20%的人会把填好的问卷寄回给你,也就是1000个人中有200个人会回复你的问卷。用统计学术语来说,我们说基线响应率是20%;
二。如果您现在邮寄问卷,预计将收到1,000份问卷中的200份,这可能达不到问卷调查所需的回收率。比如,工作手册规定邮寄调查问卷的回收率要在25%以上;
三。通过之前的问卷调查,你收集了被采访者的相关信息,比如年龄,教育程度等等。使用这些数据,您可以确定哪些受访者对问卷做出了积极回应。假设你用这些过去的数据建立了一个模型,这个模型对这1000个人进行了分类。现在你可以从你的1000人名单中选出100个回应最积极的人,这10%的人回应率是60%。那么,对于这100人的群体(我们称之为前10%),通过使用我们的模型,相对增益或提升值为60%/20%=3;换句话说,与不使用模型的随机选择相比,使用模型进行选择有三倍的优势;
四。同样,对于总样本中任何比例的人群,我们都可以计算出相应的提升指数。比如我们可以计算出前20%群体的推广指数。
III)结论是提升指数越大,模型运行效果越好。
2.建立提升表(绘制提升图)的步骤,以验证信用评分模型为例:
I)使用已建立的评分模型对我们想要验证的样本进行评分。样本中的每个个体都会得到一个分数,要么是违约概率,要么是分数;
II)根据以上计算的分数以降序对样本进行排序;
III)将排序后的样本依次分成10组相同的数字,我们设置了一个名为decile的变量,依次取10个值,1,2,3,4,5,6,7,8,9,10。diclie1包括违约概率值较高的10%个人,diclie2包括接下来的10%群体。
IV)账户总数为每个十分位数下的样本数,为样本总数的10%;
v)边际坏账数是每个十分位数中违约的人数,即使用我们的评分模型,在十分位数1中,有25人违约,以此类推;
VI)坏账累计数,45表示前两个十分位数有45人违约,以此类推;
VII)边际坏账率是每十分位数中坏账的比率。对于decile1,边际坏账率为25/100;
VIII)计算每个总和十分位数的累积坏账率。例如,对于前两个十分位数,即整个样本的20%,累计坏账率等于(25 20)/(100 100);
IX)在每个十分位数中,LIFT指数(Lift)是对应的累计坏账率与平均坏账率的偏离程度。计算公式为(累计坏账率-平均坏账率)/平均坏账率,习惯上乘以a 100。
x)注:有些处理中,直接用每十分位数的累计坏账率除以平均坏账率得到提升指数,两者之差为1,一个是相对偏差,一个是偏差。
XI)就我们的信用评分模型而言,其目的是尽可能区分人,比如“好”客户和“坏”客户。提升指数越大,模型的运行效果越好。
表1:升降台
(注:本表中的数字纯粹用于演示,没有任何实际背景)
Python机器学习生物信息学系列(博主实录):http://dwz.date/b9vw
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。