python正则表达式提取字符串,python 正则表达式元字符
我有一个正则表达式字典,我想计算字典中包含复合词的主题和正则表达式的匹配项。在进口熊猫作为螺纹中径
terms={animals :(狐狸俄罗斯褐鹿秃鹰北极狐),
人物:(约翰亚当斯罗布史蒂夫超人超人),
游戏:(篮球篮球bball)
}
df=pd .数据帧({
分数:[4,6,2,7,8],
福:[超人在寻找一只俄罗斯棕色的鹿。、"约翰亚当斯昨天在史蒂夫叫他之前就开始和罗布打篮球了"、"篮球是史蒂夫放学后玩的一项运动"、"秃鹰三次飞过北极狐"、"狐狸被发现打篮球了?"]
})
为了计算匹配数,我可以使用类似于问题的代码:Python熊猫统计一个字符串中正则表达式匹配的个数。但是它用空格分割字符串,然后计算不包含复合项的项。有什么替代方法可以让由空格连接的复合词包含在内?在
^{pr2}$
最终结果应该是:Foo分数动物人类\
超人在寻找一只俄罗斯棕色的鹿。4 1 1
约翰亚当斯开始和罗一起打篮球.6 0 3
篮球是史蒂夫玩的一项运动.2 0 1
3秃鹰飞过北极狐狸三t.7 3 0
这只狐狸在打篮球时被发现8 1 0
比赛
0 0
1 1
2 2
3 0
4 1
请注意,对于第三行,北极狐中的"狐狸"一词和"北极狐"一词应分别计算一次(两次合计),作为动物列。在
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。