濾掉一些特殊符號

抓回來的東西有太多的特殊符號(特別是拍賣. 購物等等的站)..
將那些符號濾掉比較好瀏覽. 寫個小 function 來小濾一下~ 🙂
//filter out symbols 濾掉一些星星等等的碼
function replace_char($s) {
$s = preg_replace("/([\x80-\xFF].|[\x02-\x7F])/", "\x01\$1", $s);
$pattern = "/(\x01\xa1[\xb3-\xbf]|\x01\xa2[\xa1-\xae])/";
$s = preg_replace($pattern, " ", $s);
$s = preg_replace("/[\x01]/", "", $s);
// 內碼表除了全形 0~9 和 ㄅㄆㄇ外全濾掉, 不過可能會造成有些中文字異常.
// 下述的不建議使用.
$s = preg_replace("/(\xa1[\x4a-\xfe])|(\xa2[\x40-\xae])/", "", $s);
return $s;
}

作者: Tsung

對新奇的事物都很有興趣, 喜歡簡單的東西, 過簡單的生活.

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料