[python] 合併檔案中相同網域的網址(絕對路徑整合相對路徑)


整併兩個相同路徑的網址

應用場景:人工智慧、網路爬蟲。
假設目前有 2 個網址:一個絕對路徑,一個是相對路徑。
url1 = "https://blog.webgolds.com/view/522"
url2 = "../images/right.png"

想要達到這樣的效果:
https://blog.webgolds.com/images/right.png

該怎麼做呢?
以下是使用urlparse(Python 2 )跟urllib(Python 3)的方式。

Python 程式碼

使用 urlparse.urljoin :

>>> import urlparse
>>> urlparse.urljoin(url1, url2)

​使用Python 3 (urlparse 被命名成 urllib.parse)  :

>>> import urllib.parse
>>> urllib.parse.urljoin(url1, url2)

輸出結果:
'http://blog.webgolds.com/images/right.png'


 

參考文章

How to join absolute and relative urls?
https://docs.python.org/2/library/urlparse.html#urlparse.urljoin
https://docs.python.org/3.6/library/urllib.parse.html#urllib.parse.urljoin
 

錯誤排除

出現以下錯誤:
import urlparse Traceback (most recent call last): File "python", line 1, in <module> ModuleNotFoundError: No module named 'urlparse'
 
The urlparse module is renamed to urllib.parse in Python 3

 

回上一頁

相關文章:

喜歡這篇文章嗎?立即分享

Posted : / Views: 107
Last updated :2017-12-26