python一定要装在C盘吗,python可以安装在u盘里吗
本文包括http://www.Sina.com/http://www.Sina.com/人物,http://www.Sina.com/chart截图。
建议阅读http://www。Sina.com/http://www.Sina.com/minute
3886
0
介绍
袖扣是一个视觉库,数据分析中到处都是8和20,的数据帧,3333http://ww。新浪网
首先,介绍可能需要的包。
将袖扣软件包引入importportpandasasportnumpyasnpimportseabornasimportmatplotlib . pyplotplt % matplotlibinline。
导入袖扣,因为cf选择离线模式并生成本地图像。也就是说,它不会上传到系统。
Cf.go_offline()如果你熟悉我的风格,你就会知道我最喜欢的颜色。RGB设置如下。
color=[ RGB (220,38,36 ) ]、RGB(43、71、80)、RGB(69、160、162)、RGB(232、122、89)、RGB(145)
在袖扣中,曲线函数是df.iplot,虽然吃了几次,但是iplot函数的参数很多。一些参数描述如下。
种类:图表类型,如散点图、饼图、直方图等
图案:线条、标记和线条标记。分别表示折线、点、折线、点。
颜色:对应于轨道的颜色。
Dash)对应于轨道的虚、实线、破折号和dashdot。
宽度:轨道厚度
XTitle:横坐标名称
YTitle:纵坐标名称
标题:图表标题
我现在在学袖扣。也就是说,我在学习新的东西。从一开始就看不到与之相关的一切。没有时间和精力。我只是用袖扣处理具体的任务,然后找到合适的知识点来完成任务。
我们今天的任务是将信贷组合形象化。
对在新加坡的读者
考虑一个有100个不同贷方的“样本投资组合”。有三个假设。
的总规模为1000,这意味着每个贷方的平均“敞口”为10。
末尾有彩蛋来自威布尔模拟,范围从1到小于50。
根据卡方模拟,贷款人http://www.sina.com/(无条件违约概率)的平均值设定为1%。
我模拟了默认利率和open saving为numpy格式的两个文件,加载到变量P和C中进行保存,其中n是借款人数,100。
DP file=OS . getcwd((\ defaultprobabilities . npy exp file=OS . getcwd))\ exposures . npy c=NP . load
在袖扣中,我们在DataFrame中创建了一些东西,所以先把P转换成DataFrame df,然后用df.iplot))函数。
因为想看违约率的分布函数,kind设置成直方图,分成100个盒子。在此基础上添加垂直线vline。
p,我们发现值接近1%,非常接近之前的卡方分布。之后设置一些坐标名,地图名,颜色,主题就很简单了(ggplot美如图画,用过的都好),就不赘述了。
df=pd。data frame(p * 100)df . iplot(kind= histogram ,histnorm=probability ,bins=100,vline=df.mean()。tolist(),title=DefaultProbability ,xTitle=Percent ,yTitle=RelativeFrequency ,color=rgb(43,71,80),theme=ggplot )
从上图可以看出,违约概率的取值范围是从0%到7%,偏右。
损失的分布
用同样的方法,画出损失分布。
df=pd。data frame(c)df . iplot(kind= histogram ,histnorm=probability ,bins=100,vline=df.mean()。tolist(),title=LossExposure ,xTitle=USD ,yTitle=RelativeFrequency ,color=rgb(220,38,36),theme=ggplot )
从上图可以看出,损失的取值范围是从0到50,也是偏右的。
组合可视化
信用包括两层信息,P和C,它们被组合成一个新的数据框架。此时,我们要显示每个借款人的损失敞口(横轴)和其无条件违约概率(纵轴)的散点图,因此kind设置散点图。
为了看起来更直观,我们用每个散乱点的面积来表示损失敞口。面积越大,损失敞口越大。然后点向右移动变大,所以大小设置为C,C是损失敞口的值。
df=pd。DataFrame(np.vstack((p*100,c))。t,columns=[DefaultProbability , loss exposure ])df . iplot(kind= scatter ,x=LossExposure ,y=DefaultProbability ,mode=markers ,size=c,title= losspersurevsdefaultprobability ,xTitle= USD ,yTitle=Percent ,color=color,theme=ggplot )
我们可以做一些观察:
大部分大仓位的违约概率不高,但也有少数例外。例如,损失敞口为30,违约率为7%。
其他高违约率的借款人没有超过10%的损失敞口。
最大单仓位(接近50)的违约概率极小,几乎为零。
接下来我们来看不同地区的信贷组合分布。概括地说,地区可以按地理、行业或借款人规模分类。
在这种情况下,我们将100名借款人随机分配到三个虚构的区域,即Alpha、Beta和Gamma。我们还随机生成一些区域数据,并将它们存储在regions.npy中
rg file=OS . getcwd() \ \ regions . npy region=NP . load(rgn file)在绘图中,每个散点根据区域分类(类别在代码中设置为 region )以不同的颜色显示。在实际环境中,每个散点还会包含借款人ID或姓名,可以帮助我们锁定一些特定的借款人。
df=pd。DataFrame(np.vstack((p*100,c,region))。t,columns=[DefaultProbability , LossExposure , Region ])df . loc[df[ Region ]= Alpha df . loc[df[ Region ]==2, Region ]= Beta df . loc[df[ Region ]==3, Region ]= Gamma df . iplot(kind= scatter ,x=LossExposure ,y=DefaultProbability ,mode=markers ,categories=Region ,size=20,title=Regional Distribution ,xTitle
我们可以做一些观察:
根据数据区,没有显示模式。
最上面深蓝点(30.41,6.82)对应的借款人是高风险头寸(损失敞口大,违约率高)。
最右边(47.80,0.02)的深蓝点持仓最大,但违约风险不大。
底部和中部有一组借款人(1暗青色,2红色,2青色)。损失敞口虽然大,但违约率不高,1%左右。
左上角有一群借款人(2暗青色,3红色)违约率很高,但损失敞口很小。
通过可视化信贷组合,我们可以快速看到组合中的一些特征。接下来我们来计算一下这个组合的一些有用的指标,比如预期损失(预期损失,EL),损失波动(损失波动率,LV),风险价值(风险价值,VaR)和期望损失(预期亏空,ES)
Stay Tuned!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。