Linux 如何抓取網頁頁面並將相關連結置換或完整抓取下來

網頁的頁面一般 css / js / img 這些會是相對路徑、獨立網址.. 等等, 但是想要抓下頁面時, 直接瀏覽此頁, 是可以頁面完整正常顯示的, 要如何做呢?

一般頁面抓下來時, 相對路徑的檔案, 就會抓不到, 於是就很容易頁面跑掉、某些離線應該能有的功能會無法使用, 想要將這些抓下來, 或者全部改成線上的網址, 可以使用 wget 來達成~

註: 本來想說要自己寫 code 來處理, 將 href / src 抓出來, 若不是 http / https / file / ftp :// 就要抓下來(含目錄), 或者就是要寫上路徑.. 等等, 後來想到 wget 的 mirror 功能, 果然 man wget 就找到合適的用法.

WGET 使用兩個參數來達成上述講的功能:

--convert-links – convert all the links (also to stuff like CSS stylesheets) to relative, so it will be suitable for offline viewing.
--page-requisites – Download things like CSS style-sheets and images required to properly display the page offline.

把網頁抓下來, 自動把路徑修復

分析網頁路徑, 在 local 把相關目錄建立, 然後把 css / js / img 等等都抓下來

作者: Tsung

對新奇的事物都很有興趣, 喜歡簡單的東西, 過簡單的生活. 檢視「Tsung」的全部文章

在〈Linux 如何抓取網頁頁面並將相關連結置換或完整抓取下來〉中有 5 則留言

請問版主
CURL也有同樣的功能嗎?

Tsung表示:

2014 年 10 月 05 日19:42:45

CURL 我沒注意到有沒有這種功能耶, 我都沒拿 CURL 做這種事情~
Dum表示:

2014 年 10 月 06 日09:31:53

謝謝版主的回應
想再請教版主一個問題
將wget redirecting到standard out
會hang住
該怎麼解決這問題呢?
Tsung表示:

2014 年 10 月 06 日09:37:38

他在抓的時候會去解析, 那並不是 hang 住, 你等他一下, 它解析完就會開始抓 css / js .. 那些東西下來.
Dum表示:

2014 年 10 月 06 日10:01:40

版主
剛剛試一下
同一網頁
如果是存成file
速度很快
但是redirecting到standard out
就停好久
等了半天也出不來 .....

Dum表示:

2014 年 10 月 03 日17:55:23

請問版主
CURL也有同樣的功能嗎?

回覆
1. Tsung表示:
  
  2014 年 10 月 05 日19:42:45
  
  CURL 我沒注意到有沒有這種功能耶, 我都沒拿 CURL 做這種事情~
2. Dum表示:
  
  2014 年 10 月 06 日09:31:53
  
  謝謝版主的回應
  想再請教版主一個問題
  將wget redirecting到standard out
  會hang住
  該怎麼解決這問題呢?
3. Tsung表示:
  
  2014 年 10 月 06 日09:37:38
  
  他在抓的時候會去解析, 那並不是 hang 住, 你等他一下, 它解析完就會開始抓 css / js .. 那些東西下來.
4. Dum表示:
  
  2014 年 10 月 06 日10:01:40
  
  版主
  剛剛試一下
  同一網頁
  如果是存成file
  速度很快
  但是redirecting到standard out
  就停好久
  等了半天也出不來 .....

「Hank」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
非常感谢。完美解决了我的问题，确实是安装…
「Tsung」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
很高興能對您有些幫助~ 感謝~~ :)
「Hank」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
非常感谢，这个博客完美解决了我的问题。确…
「Tsung」於〈一頁式網購詐騙的幾個判斷方式〉發佈留言2025 年 06 月 20 日
嗯嗯，手法都是大同小異的~~
「johnroyer日落」於〈一頁式網購詐騙的幾個判斷方式〉發佈留言2025 年 06 月 19 日
感覺和手游很像 (?)