April 07, 2005

濾掉一些特殊符號

抓回來的東西有太多的特殊符號(特別是拍賣. 購物等等的站)..
將那些符號濾掉比較好瀏覽. 寫個小 function 來小濾一下~ :)

//filter out symbols 濾掉一些星星等等的碼
function replace_char($s) {
$s = preg_replace("/([\x80-\xFF].|[\x02-\x7F])/", "\x01\$1", $s);
$pattern = "/(\x01\xa1[\xb3-\xbf]|\x01\xa2[\xa1-\xae])/";
$s = preg_replace($pattern, " ", $s);

$s = preg_replace("/[\x01]/", "", $s);

// 內碼表除了全形 0~9 和 ㄅㄆㄇ外全濾掉, 不過可能會造成有些中文字異常.
// 下述的不建議使用.
$s = preg_replace("/(\xa1[\x4a-\xfe])|(\xa2[\x40-\xae])/", "", $s);

return $s;
}

Posted by jon at April 7, 2005 08:48 AM | TrackBack
Comments
Post a comment









Remember personal info?