python绘制省界市区范围,python画出省级地图

　　在做NLP(自然语言处理)相关的任务时，经常会遇到需要识别和提取省、市、行政区的情况。今天，我想向大家介绍一个模块。你只需要把字符串传递给这个模块，他就可以把这个字符串中的省市区关键词返回给你。快来学吧。

　　00-1010 1.准备2。基本使用3。高级使用在做NLP(自然语言处理)相关的任务时，我们经常会遇到需要识别和提取省、市、行政区的情况。虽然我们可以通过逐个搜索关键词表来达到提取的目的，但是需要先收集各省市的关键词表，相对比较繁琐。

　　今天，我想向大家介绍一个模块。你只需要把字符串传递给这个模块，他就可以把这个字符串中的省市区关键词返回给你，并在图片上给你标注出来。这是Cpca模块。

1.准备

　　最基本的省市抽取可以通过两行代码实现：

　　#微信官方账号： Python实用合集

　　# 2022/06/23

　　importcpca

　　location_str=[

　　广东省深圳市福田区巴丁街深南中路1025号新城大厦一楼，

　　特斯拉Giga Shanghai是特斯拉在美国以外的第一家超级工厂，位于中华人民共和国上海。

　　三星堆遗址位于中国四川省广汉市西部三星堆镇鸭河上，属于青铜时代文化遗址

　　]

　　df=cpca.transform(location_str)

　　打印(df)

　　效果如下：

　　城市地址广告代码

　　广东省深圳市福田区巴丁街深南中路1025号新城大厦一楼440304室

　　1上海一个都没有。310000

　　2四川省德阳市广汉城西三星堆镇鸭河，属于青铜时代文化遗址510681。

　　第三条关注广汉市。cpca不仅在声明中承认广汉市为县级市，还自动匹配其代管城市德阳市。不得不说很厉害。

　　如果想知道程序从字符串中提取省市名称的位置，可以添加一个pos_sensitive=True参数3360。

　　#微信官方账号： Python实用合集

　　# 2022/06/23

　　importcpca

　　location_str=[

　　广东省深圳市福田区巴丁街深南中路1025号新城大厦一楼，

　　特斯拉Giga Shanghai是特斯拉在美国以外的第一家超级工厂，位于中华人民共和国上海。

　　三星堆遗址位于中国四川省广汉市西部三星堆镇鸭河岸边，属于青铜时代文化遗址

　　]

　　df=cpca.transform(location_str，pos_sensitive=True)

　　打印(df)

　　效果如下：

　　(base)g : \ push \ 20220623 pythonbsp

　　;1.py
省市区地址 adcode 省_pos 市_pos 区_pos
0广东省深圳市福田区巴丁街深南中路1025号新城大厦1层440304036
1上海市 None None 。31000038-1-1
2四川省德阳市广汉市城西三星堆镇的鸭子河畔，属青铜时代文化遗址5106819-112

　　它标记出了识别到省、市、区的关键位置（index），当然如果是德阳市这种特殊的识别会被标记为-1.

3.高级使用

　　它还可以从大段文本中批量识别多个地区：

# 公众号: Python 实用宝典

　　# 2022/06/23

　　import cpca

　　long_text = "对一个城市的评价总会包含个人的感情。如果你喜欢一个城市，很有可能是喜欢彼时彼地的自己。"\

　　 "在广州、香港读过书，工作过，在深圳买过房、短暂生活过，去北京出了几次差。"\

　　 "想重点比较一下广州、深圳和香港，顺带说一下北京。总的来说，觉得广州舒适、"\

　　 "香港精致、深圳年轻气氛好、北京大气又粗糙。答主目前选择了广州。"

　　df = cpca.transform_text_with_addrs(long_text, pos_sensitive=True)

　　print(df)

　　效果如下：

(base) G:\push\20220623>python1.py
省市区地址 adcode 省_pos 市_pos 区_pos
0广东省广州市None440100-144-1
1香港特别行政区NoneNone81000047-1-1
2广东省深圳市None440300-158-1
3北京市NoneNone11000071-1-1
4广东省广州市None440100-186-1
5广东省深圳市None440300-189-1
6香港特别行政区NoneNone81000092-1-1
7北京市NoneNone110000100-1-1
8广东省广州市None440100-1110-1
9香港特别行政区NoneNone810000115-1-1
10广东省深圳市None440300-1120-1
11北京市NoneNone110000128-1-1
12广东省广州市None440100-1143-1
　　

　　不仅如此，模块中还自带一些简单绘图工具，可以在地图上将上面输出的数据以热力图的形式画出来：

# 公众号: Python 实用宝典

　　# 2022/06/23

　　import cpca

　　from cpca import drawer

　　long_text = "对一个城市的评价总会包含个人的感情。如果你喜欢一个城市，很有可能是喜欢彼时彼地的自己。"\

　　 "在广州、香港读过书，工作过，在深圳买过房、短暂生活过，去北京出了几次差。"\

　　 "想重点比较一下广州、深圳和香港，顺带说一下北京。总的来说，觉得广州舒适、"\

　　 "香港精致、深圳年轻气氛好、北京大气又粗糙。答主目前选择了广州。"

　　df = cpca.transform_text_with_addrs(long_text, pos_sensitive=True)

　　drawer.draw_locations(df[cpca._ADCODE], "df.html")

　　运行的时候可能会报这个错：

(base) G:\push\20220623>python1.py
Traceback (most recentcalllast):
File"1.py",line12, in<module>
drawer.draw_locations(df[cpca._ADCODE],"df.html")
File"G:\Anaconda3\lib\site-packages\cpca\drawer.py",line41, in draw_locations
import folium
ModuleNotFoundError: No module named'folium'
　　

　　使用pip安装即可：