python数据处理面试题,python测试开发面试题及答案

  python数据处理面试题,python测试开发面试题及答案

  以下题目均非原创,只是汇总

  Python数据分析部分1. 如何利用SciKit包训练一个简单的线性回归模型

  用线性模型。线性回归()函数

  #创建线性回归objectregr=linear_model。LinearRegression()#使用训练集regr.fit(data_X_train,data_y_train)2. 例举几个常用的python分析数据包及其作用训练模型

  数据处理和分析:NumPy,SciPy,Pandas

  机器学习:SciKit

  可视化:Matplotlib,Seaborn

  3. 如何利用Numpy对数列的前n项进行排序

  使用argsort()函数:x[x [: n-1]。argsort ()]

  4. 如何检验一个数据集或者时间序列是随机分布的

  画lagplot(关联图),如果图上的点是分散的,那就是随机的。

  5. 在python中如何创建包含不同类型数据的dataframe

  使用pandas包的DataFrame函数的系列创建列,然后使用dtype定义类型:

  df=pd。DataFrame({x: pd。Series([1.0 , 2.0 , 3.0],dtype=float), y: pd。系列([1 , 2 , 3],dtype=int)})

  6. Pandas中使用的标准数据缺失标志是什么

  圆盘烤饼

  7. 描述numpy array比python list的优势

  A.numpy数组比python list更紧凑,存储数据占用空间少,读写速度快。(这是因为python list存储了对象(至少16个字节)的指针(至少4个字节);数组存储单个变量(例如,单精度浮点数是4个字节,双精度是8)。

  B.数组可以直接使用向量和矩阵处理函数,非常方便。

  8. 如何检验numpy的array为空

  使用大小函数,例如

  A=np.array([])print a.size # 0 **9。如何检查熊猫数据帧是否为空?

  使用空函数

  Python基本操作部分1. 如何在python中复制对象

  使用复制包的复制和深层复制功能。其中,copy只复制对象本身,不复制对象中引用的其他对象;Deepcopy不仅复制对象本身,还复制对象中引用的其他对象。

  2. PEP8是什么

  Python语言编程规范,提高代码可读性。

  3. init.py是什么

  用于将模块导入目录的空文件。比如一个模块是maindir/subdir/module.py,init.py可以让它按照下面的形式导入。导入maindir.subdir.module

  4. range()和xrange()函数的差异

  Range()生成一个列表,而xrange()生成一个迭代器。例如:

  range(5) # [0,1,2,3,4]xrange(5)列表(xrange(1,5)) # [1,2,3,4]5. 如何对list中的item进行随机重排

  使用shuffle()函数

  6. python中用于发现bug的工具

  皮林特和皮切克。Pylint可以检查模块是否符合所有的编程标准;Pychecker是一个静态分析工具。

  7. 装饰器的作用

  装饰器可以用来装饰函数或类。Decorator可以包装一个函数或类,在它执行之前或之后调用decorator函数,从而从大量与函数本身无关的函数中提取出完全相同的代码,继续重用。经典的厨房场景包括检查权限、跟踪参数、日志登录等。

  def make bold(fn):def wrapped():return b fn()/b return wrapped def make italic(fn):def wrapped():return I fn()/I return wrapped @ make bold @ maketalicdef hello():return hello world Python程序解析以下部分代码的输出?def multipliers():return[lambda x:I * x for I in range(4)]print[m(2 for m in multipliers()]输出为[6,6,6,6]。出现这种情况的原因是Python的闭包的后期绑定,这意味着调用内部函数时会发现闭包中的变量。所以结果就是,当任何一个由multipliers()返回的函数被调用的时候,那个时候,I的值是在它被调用的时候在周围的作用域中查找的。到那时,无论调用哪个返回的函数,for循环都已经完成,I的最后一个值是3。因此,每个返回函数相乘的值是3。所以等于2的值被传入上面的代码,它们将返回值6(例如:3 x 2)。

  是下面的代码错误列表=[a , e , I , o , u] printlist [8:]输出是[]。访问起始索引大于列表成员数的列表片段不会导致IndexError,只会返回一个空列表。

  以下代码的output def foo(I=[])I . append(1)return ifoo()foo()output is[1],[1,1]。新的默认列表仅在定义函数时创建一次。当指定的list参数没有调用foo时,它使用相同的list。

  数学部分1. 什么是逻辑坚定的烤鸡回归(logistic regression)

  逻辑坚定烤鸡回归经常指的是逻辑回归模型,用来预测参数之间的组合可能输出的二元结果。

  2. 推荐系统、协同过滤

  3. P值的意义

  决定假设检验的结果是否显著。

  4. 监督学习和非监督学习,机器学习算法

  5. A/B测试

  检验两个变量A和B的随机实验的统计结果。目的是识别变化对网页点击率的影响,从而获得最大的变化。

  6. 特征值和特征向量

  经过数据分析,可以计算相关矩阵和协方差矩阵的特征向量,确定线性变换的方向。特征值表示特征向量的方向变换或压缩的强度。

  7. 如何评价一个逻辑坚定的烤鸡模型

  用分类矩阵检查真阴性和假阳性的一致性分析:检查逻辑坚定的烤鸡模型区分事件是否发生的能力并与随机选择模型8. 项目分析的步骤进行比较

  了解问题探索数据,为建模和测试准备数据,在线执行并跟踪9. 如何处理缺失数据?(如果缺失的数据不可得,将采用何种手段收集?)

  首先判断缺失数据是否有意义。如果没有意义或者缺失数据比例超过80%,就直接删除。如果缺失数据是有规律的,就要根据其变化规律猜测二次缺失值;如果数据不规则,用其他值替换它:

  如果数据符合正态分布,缺失值将被期望值替换。

  如果数据是类型变量,则使用默认类型值,而不是缺少的值。

  10. 描述K-Means Clustering算法

  11. 逻辑坚定的烤鸡回归和线性回归的区别

  烧鸡坚定回归的预测值为二元,0或1;线性回归的预测值是连续的。

  12. 如何证明根号2是无理数

  13. 统计中国有多少树

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: