PHP file_get_contents 加送 Header (User-Agent)

PHP 要抓遠端的資料,通常都會使用 CURL,不過常常偷懶會直接拿 file_get_contents 來用

不過 file_get_contents 有時後會遇到需要判斷 User-Agent 等等的,需要加送 Header 資訊,要加送這些資訊要怎麼做呢?

閱讀全文〈PHP file_get_contents 加送 Header (User-Agent)〉

PHP 於 Header 送 noindex 給 Crawler bot

某些頁面不想要讓 Search engine (Google、Bing) 的 crawler bot 爬,有幾種方法可以使用:

  1. HTML Meta Tag
  2. 使用 robots.txt
  3. 於 HTTP Header 送 X-Robots-Tag

此篇主要紀錄 HTTP Header 的作法

閱讀全文〈PHP 於 Header 送 noindex 給 Crawler bot〉

Linux 抓取 Mp4 檔案的時間、長、寬等相關資料

Linux 想要抓取 Mp4 檔案的時間、長度、寬度等等 Meta 的資訊,要怎麼快速拿到呢?

立刻想到的是,萬用的 file,不過看來是拿不到想要的資訊了~

  • $ file foo.mp4
    foo.mp4: ISO Media, MP4 Base Media v1 [IS0 14496-12:2003]

用 file 拿不到的話,要怎麼辦呢?

閱讀全文〈Linux 抓取 Mp4 檔案的時間、長、寬等相關資料〉

PHP 送 301 / 302 轉址的 Header

以往 301 我都是設在 Apache 裡面,如下:

RewriteRule ^news$  http://example.com/news/ [R=301,NE,L]

想要在 PHP 送 301 / 302 Redirect 的 Header 要如何寫?

HTTP 定義 301 / 302 的 Header 意義:

  • 301: 永久轉址 (Permanently Moved)
  • 302: 臨時轉址 (Temporarily Moved)

閱讀全文〈PHP 送 301 / 302 轉址的 Header〉