python分组统计excel数据,用excel将数据分组
1.场景描述由于文本相似度的热度统计(python版本)需要根据故障类型分组统计。excel需要分组,然后分成字进行统计。简单记录一下,有需要的朋友可以直接拿。不客气!
2.解决方案中,先用pandas包进行分组,然后在分词前获取具体细节(此处不进行分词)。只介绍python下的excel分组,然后处理具体细节。
2.1完整代码导入熊猫as PDIF _ _ name _ _= _ _ main _ _ :输入文件=软件种类衣服-source . xlsx data=PD . read _ excel(输入文件)grp1=data.groupby(待分类)rcount=1 for name,group in grp 1:print(group)name=name . replace( \ n , )。替换范围内I的(/,)(len (group)): row=group.iloc [i]。values #如果单元格为none,则返回listcell=row [1]:如果不为isinstance,则继续(cell,Str):continue item=cell . strip( \ n \ r )。Split (\ t) string=item [0]如果string为none或len(string)==0:continue else:print(在此分组后获取详细值,软件友好的服装可以单独处理。类别:名称具体值:字符串如果您觉得文章对您有帮助,请第一时间搜索微信“软件友好服”阅读或交流!2.2执行效果有待分类。原因0:软件类服装1主机无法开机。软件类服装1有时无法开机。软件类服装1通电。软件类服装的详细价值可以单独处理。类别:软件类服装1具体值:主机不能通电。软件类服装可以单独加工。类别:软件类服装1具体值:有时无法开机此处获取分组后的详细值,类别:软件类服装1具体值:开机待分类,原因3软件类服装2自检错误或死机4软件类服装2机器噪音大此处获取分组后的详细值,软件类服装可单独处理。类别:软件类服装2具体值:自检错误或崩溃。这里得到分组后的详细数值,软件类服装可以单独处理。类别:软件类服装2具体数值:机器噪音大分类。原因5软件类服装3噪音问题。这里得到分组后的详细数值,软件类服装可以单独处理。类别:软件类服装3具体数值:噪音问题2.3软件类服装-source.xlsx待分类。原因软件类服装1主机无法开机。软件类服装1有时无法开机。软件类服装2自检错误或死机软件类服装2机器噪音大软件类服装3噪音问题更多知识请关注公众号:「软件慈祥的服饰」,IT技术及相关干货分享,回复关键词获取相应干货,java10-59000,发送100多万张市售高清图片;图片,刚毕业发月薪“20k”的java面试问题,持续更新中,如“面试”、“软考”等。并且已经在整理了。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。