Python中url,实现一个解析url的方法
Python中的Urlparse模块主要用于解析url中的参数,并按照一定的格式对url进行拆分或拼接。
1.urlparse.urlparse
将url分成6部分,返回一个包含6个字符串项的元组:协议、位置、路径、参数、查询、片段。
importurlparse
URL _ change=URL parse . URL parse( https://I . cn blogs.com/edit posts . aspx?opt=1 )
URL _ change的输出结果是:
Parseresult (scheme= https ,netloc= i.cnblogs.com ,path=/editposts.aspx ,params= ,query= opt=1 ,fragment= )其中scheme是协议,netloc是域名服务器,path是相对路径,params是参数,query是查询。
Urlparse。解析_ QS(URL class。urlass(网址)。query)这是为了获得一个urlass的查询条件。urlass(网址)。查询。
parse_qs有几种实现。
Urlparse.parse_qs返回字典。
Urlparse.parse_qsl返回列表。
2. urlparse.urlsplit
类似于urlparse,将url分成五个部分,返回一个包含五个字符串项的元组:协议、位置、路径、查询和片段。
importurlparse
URL _ change=URL parse . URL split( https://I . cn blogs.com/edit posts . aspx?opt=1 )
打印_更改
拆分结果(scheme= https ,netloc= i.cnblogs.com ,path=/editposts.aspx ,query= opt=1 ,fragment= )其中scheme是协议,netloc是域名服务器的相对路径,query是查询条件。
3.urlparse.urljoin
把相对地址组合成一个url,输入没有限制。开头必须是http://,否则前面不会合并。
importurlparse
new _ URL=URL parse . URL join( https://Baidu.com/SSSS/, 88888 )
printnew_url
输出https://baidu.com/ssss/88888如果您输入诸如new _ URL=urlbase . urlogin( 122 , 8888 )这样的错误消息,您不会将它们组合起来并输出 8888 。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。