PHP 於 Header 送 noindex 給 Crawler bot

某些頁面不想要讓 Search engine (Google、Bing) 的 crawler bot 爬,有幾種方法可以使用:

  1. HTML Meta Tag
  2. 使用 robots.txt
  3. 於 HTTP Header 送 X-Robots-Tag

此篇主要紀錄 HTTP Header 的作法

閱讀全文〈PHP 於 Header 送 noindex 給 Crawler bot〉

Linux 抓取 Mp4 檔案的時間、長、寬等相關資料

Linux 想要抓取 Mp4 檔案的時間、長度、寬度等等 Meta 的資訊,要怎麼快速拿到呢?

立刻想到的是,萬用的 file,不過看來是拿不到想要的資訊了~

  • $ file foo.mp4
    foo.mp4: ISO Media, MP4 Base Media v1 [IS0 14496-12:2003]

用 file 拿不到的話,要怎麼辦呢?

閱讀全文〈Linux 抓取 Mp4 檔案的時間、長、寬等相關資料〉

PHP 送 301 / 302 轉址的 Header

以往 301 我都是設在 Apache 裡面,如下:

RewriteRule ^news$  http://example.com/news/ [R=301,NE,L]

想要在 PHP 送 301 / 302 Redirect 的 Header 要如何寫?

HTTP 定義 301 / 302 的 Header 意義:

  • 301: 永久轉址 (Permanently Moved)
  • 302: 臨時轉址 (Temporarily Moved)

閱讀全文〈PHP 送 301 / 302 轉址的 Header〉

JSON 與 JavaScript 的 Header Content-Type

某些 CDN 會檢查 HTTP Header 的 Content-Type, 若是 JavaScript、JSON 是動態產生的, 會需要額外送正確的 Header 回去.

若是靜態的話, Apache(apache2.2-common) 預設會去讀取 /etc/mime.types (/etc/apache2/mods-available/mime.conf), 如下述:

  • application/javascript javascript
  • application/json json

閱讀全文〈JSON 與 JavaScript 的 Header Content-Type〉