python一定要装在C盘吗,python可以安装在u盘里吗

　　本文包括http://www.Sina.com/http://www.Sina.com/人物，http://www.Sina.com/chart截图。

　　建议阅读http://www。Sina.com/http://www.Sina.com/minute

　　3886

　　介绍

　　袖扣是一个视觉库，数据分析中到处都是8和20，的数据帧，3333http://ww。新浪网

　　首先，介绍可能需要的包。

　　将袖扣软件包引入importportpandasasportnumpyasnpimportseabornasimportmatplotlib . pyplotplt % matplotlibinline。

　　导入袖扣，因为cf选择离线模式并生成本地图像。也就是说，它不会上传到系统。

　　Cf.go_offline()如果你熟悉我的风格，你就会知道我最喜欢的颜色。RGB设置如下。

　　color=[ RGB (220，38，36 ) ]、RGB(43、71、80)、RGB(69、160、162)、RGB(232、122、89)、RGB(145)

　　在袖扣中，曲线函数是df.iplot，虽然吃了几次，但是iplot函数的参数很多。一些参数描述如下。

　　种类：图表类型，如散点图、饼图、直方图等

　　图案：线条、标记和线条标记。分别表示折线、点、折线、点。

　　颜色：对应于轨道的颜色。

　　Dash)对应于轨道的虚、实线、破折号和dashdot。

　　宽度：轨道厚度

　　XTitle:横坐标名称

　　YTitle:纵坐标名称

　　标题：图表标题

　　我现在在学袖扣。也就是说，我在学习新的东西。从一开始就看不到与之相关的一切。没有时间和精力。我只是用袖扣处理具体的任务，然后找到合适的知识点来完成任务。

　　我们今天的任务是将信贷组合形象化。

　　对在新加坡的读者

　　考虑一个有100个不同贷方的“样本投资组合”。有三个假设。

　　的总规模为1000，这意味着每个贷方的平均“敞口”为10。

　　末尾有彩蛋来自威布尔模拟，范围从1到小于50。

　　根据卡方模拟，贷款人http://www.sina.com/(无条件违约概率)的平均值设定为1%。

　　我模拟了默认利率和open saving为numpy格式的两个文件，加载到变量P和C中进行保存，其中n是借款人数，100。

　　DP file=OS . getcwd((\ defaultprobabilities . npy exp file=OS . getcwd))\ exposures . npy c=NP . load

　　在袖扣中，我们在DataFrame中创建了一些东西，所以先把P转换成DataFrame df，然后用df.iplot))函数。

　　因为想看违约率的分布函数，kind设置成直方图，分成100个盒子。在此基础上添加垂直线vline。

　　p，我们发现值接近1%，非常接近之前的卡方分布。之后设置一些坐标名，地图名，颜色，主题就很简单了(ggplot美如图画，用过的都好)，就不赘述了。

　　df=pd。data frame(p * 100)df . iplot(kind= histogram ，histnorm=probability ，bins=100，vline=df.mean()。tolist()，title=DefaultProbability ，xTitle=Percent ，yTitle=RelativeFrequency ，color=rgb(43，71，80)，theme=ggplot )

　　从上图可以看出，违约概率的取值范围是从0%到7%，偏右。

　　损失的分布

　　用同样的方法，画出损失分布。

　　df=pd。data frame(c)df . iplot(kind= histogram ，histnorm=probability ，bins=100，vline=df.mean()。tolist()，title=LossExposure ，xTitle=USD ，yTitle=RelativeFrequency ，color=rgb(220，38，36)，theme=ggplot )

　　从上图可以看出，损失的取值范围是从0到50，也是偏右的。

　　组合可视化

　　信用包括两层信息，P和C，它们被组合成一个新的数据框架。此时，我们要显示每个借款人的损失敞口(横轴)和其无条件违约概率(纵轴)的散点图，因此kind设置散点图。

　　为了看起来更直观，我们用每个散乱点的面积来表示损失敞口。面积越大，损失敞口越大。然后点向右移动变大，所以大小设置为C，C是损失敞口的值。

　　df=pd。DataFrame(np.vstack((p*100，c))。t，columns=[DefaultProbability ， loss exposure ])df . iplot(kind= scatter ，x=LossExposure ，y=DefaultProbability ，mode=markers ，size=c，title= losspersurevsdefaultprobability ，xTitle= USD ，yTitle=Percent ，color=color，theme=ggplot )

　　我们可以做一些观察：

　　大部分大仓位的违约概率不高，但也有少数例外。例如，损失敞口为30，违约率为7%。

　　其他高违约率的借款人没有超过10%的损失敞口。

　　最大单仓位(接近50)的违约概率极小，几乎为零。

　　接下来我们来看不同地区的信贷组合分布。概括地说，地区可以按地理、行业或借款人规模分类。

　　在这种情况下，我们将100名借款人随机分配到三个虚构的区域，即Alpha、Beta和Gamma。我们还随机生成一些区域数据，并将它们存储在regions.npy中

　　rg file=OS . getcwd() \ \ regions . npy region=NP . load(rgn file)在绘图中，每个散点根据区域分类(类别在代码中设置为 region )以不同的颜色显示。在实际环境中，每个散点还会包含借款人ID或姓名，可以帮助我们锁定一些特定的借款人。

　　df=pd。DataFrame(np.vstack((p*100，c，region))。t，columns=[DefaultProbability ， LossExposure ， Region ])df . loc[df[ Region ]= Alpha df . loc[df[ Region ]==2， Region ]= Beta df . loc[df[ Region ]==3， Region ]= Gamma df . iplot(kind= scatter ，x=LossExposure ，y=DefaultProbability ，mode=markers ，categories=Region ，size=20，title=Regional Distribution ，xTitle

　　我们可以做一些观察：

　　根据数据区，没有显示模式。

　　最上面深蓝点(30.41，6.82)对应的借款人是高风险头寸(损失敞口大，违约率高)。

　　最右边(47.80，0.02)的深蓝点持仓最大，但违约风险不大。

　　底部和中部有一组借款人(1暗青色，2红色，2青色)。损失敞口虽然大，但违约率不高，1%左右。

　　左上角有一群借款人(2暗青色，3红色)违约率很高，但损失敞口很小。

　　通过可视化信贷组合，我们可以快速看到组合中的一些特征。接下来我们来计算一下这个组合的一些有用的指标，比如预期损失(预期损失，EL)，损失波动(损失波动率，LV)，风险价值(风险价值，VaR)和期望损失(预期亏空，ES)

　　Stay Tuned！