Python中url,实现一个解析url的方法

  Python中url,实现一个解析url的方法

  Python中的Urlparse模块主要用于解析url中的参数,并按照一定的格式对url进行拆分或拼接。

  1.urlparse.urlparse

  将url分成6部分,返回一个包含6个字符串项的元组:协议、位置、路径、参数、查询、片段。

  importurlparse

  URL _ change=URL parse . URL parse( https://I . cn blogs.com/edit posts . aspx?opt=1 )

  URL _ change的输出结果是:

  Parseresult (scheme= https ,netloc= i.cnblogs.com ,path=/editposts.aspx ,params= ,query= opt=1 ,fragment= )其中scheme是协议,netloc是域名服务器,path是相对路径,params是参数,query是查询。

  Urlparse。解析_ QS(URL class。urlass(网址)。query)这是为了获得一个urlass的查询条件。urlass(网址)。查询。

  parse_qs有几种实现。

  Urlparse.parse_qs返回字典。

  Urlparse.parse_qsl返回列表。

  2. urlparse.urlsplit

  类似于urlparse,将url分成五个部分,返回一个包含五个字符串项的元组:协议、位置、路径、查询和片段。

  importurlparse

  URL _ change=URL parse . URL split( https://I . cn blogs.com/edit posts . aspx?opt=1 )

  打印_更改

  拆分结果(scheme= https ,netloc= i.cnblogs.com ,path=/editposts.aspx ,query= opt=1 ,fragment= )其中scheme是协议,netloc是域名服务器的相对路径,query是查询条件。

  3.urlparse.urljoin

  把相对地址组合成一个url,输入没有限制。开头必须是http://,否则前面不会合并。

  importurlparse

  new _ URL=URL parse . URL join( https://Baidu.com/SSSS/, 88888 )

  printnew_url

  输出https://baidu.com/ssss/88888如果您输入诸如new _ URL=urlbase . urlogin( 122 , 8888 )这样的错误消息,您不会将它们组合起来并输出 8888 。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: