Linux 系統管理原則 - Others 雜類 - 鄙雕兔 vs Linux

Linux 系統管理原則

很多工程師問鄙雕兔說如何管理好一個 Linux 主機, 以及怎樣保持一個系統運作正常, 每次問了之後就回答一次,  已經不知道回答幾次了, 所以乾脆就把這些回答的答案整理一下, 這些東東不一定是最標準的答案, 但至少可以保證你的主機一定不掛掉, 也不會出太大的問題,  當然若有出現意外的狀況的話, 別緊張, 先冷靜一下,  再慢慢找到問題的答案, 那就不會有太大的損失發生 :

<1> Linux 系統硬體選擇 : 要 Linux 系統穩定的話, 硬體佔有 40% 以上的比重, 若是您的硬體功力不錯, 可以自行組裝的話, 那可以參考鄙雕兔另一篇文章, 2007 硬體選擇的重點資料 , 若是硬體功力不夠強的話, 那建議直接採用有品牌的電腦主機, 比如 ASUS, DELL, MSI, GA... 等的伺服器都是不錯的選擇, 一般來說只要是能安裝 Linux 成功且燒機超過 1 週以上的硬體, 基本上來說都是 OK 的, 燒機的部份建議可以採用 SETIATHOME 的程式, 來作為 CPU 的測試, 當然也順便可以幫柏克萊大學找一下外星人.

<2> Linux 套件選擇 : 市面上有很多的 Linux 的套件可以使用, 至於有多少套件可以選擇呢 ?可以到以下網站上面查看一下 :

http://distrowatch.com/ 

鄙雕兔通常是採用 Fedora 的套件, 主要的原因是因為該套件與 Redhat 的 Enterprise 系統幾乎相同,  再加上我們公司所要服務的對象都是針對企業用戶, 所以在商用軟體的相容性及穩定性考量下, 我一直用到現在, 當然現在市面上有很多的商用 Linux 套件出現,  比如 Open Suse, Ubuntu, Slackware... 等, 都是不錯的選擇, 建議若是採用那一個套件的話, 就持續的用下去吧, 雖然都是 Linux , 但是在一些路徑設定及軟體安裝目錄上會有些差異, 若純以商業應用的便利來說, 還是只用一種是比較節省成本的, 當然若您服務的對象有各式各樣的套件, 那你就非得要去學習與接觸不可囉.

<3> 系統的更新 :  Linux 系統的安全及穩定性來說,  20% 取決於系統上所安裝的套件是否安全,  這個部份的問題常讓很多的維護工程師頭大, 因為若是服務很多的話, 那就必需要一個服務一個服務更新, 再加上版本的問題的話, 那工程師一定每天再忙這些事就 Over 了, 所以若是要採用 Linux 作為企業本身的關鍵服務系統, 一定要保持系統套件的更新順利, 若是採用 Fedora 的話可以用 Yum 每天來確認套件, 也可以幫你作版本的檢查或者更新, 若是採用 Debian 的話 可以使用 apt 來作為更新的工具, 其它的每個 Linux 套件本身都是有這樣的工具可以方便系統更新, 可以自行查看每個系統的說明, 在一個系統安裝完成後, 請一定記得在一個安全有防護的環境中上網更新, 更新完成後再作後續的設定及軟體的安裝, 不然你的系統一上線就已經有問題, 往後你會忙不完

<4> 網路防護 : 這部份是一般 Linux 工程師常忽略的部份,  約佔系統管理 10% 的比重,  依照這十多年來的經驗,  iptables 所設定的防火牆,  可以很有效的防堵網路的功擊及入侵,  當然作為一個 Internet 及 Intranet 連接來說, 也是一個很好的套件, 所以若要保持系統的安全, 請一定要熟讀  iptables 的語法及規則,  這部份有空再將我們多年來用的 Shell Script 公布大家.

<5> 服務的管理 : Linux 的套件因為功能越來越多, 不僅包伺服器功能, 也包用戶端功能, 所以在基本的安裝後會有很多的服務不需要, 若是要作為一個純伺服器功能的 Linux  主機, 可以參考鄙雕兔的另一篇文章, Linux 系統與服務,  這樣就可以將系統的漏動減少, 也可以讓資源的使用最佳化

<6> 備份處理 :  強烈建議主機一定要安裝 Raid, 並且作好異地備援, 這樣才能夠在無法預期的意外發生後, 將系統服務還原, 當然這部份需要考慮到成本因素, 可以的話備份資料請採用 HDD or SAN 來處理, 不然當你資料越來越多後, 你會發現備份的速度實在不夠快, 還會發生前一天沒有備完的部份今天的排程又開始備了, 至於要備那些個東東, 請參考 Linux 的備份與還文一文

<7> 系統監控 :  這部份是一個預警的機制, 可以採用 Mrtg 來作為圖型顯示及資源使用的管理, 除了可以方便得知流量及使用狀況外, 也可以幫工程師找到系統的瓶頸在那裏, 平常沒事的事候多看, 只要有一點異常的話就可以馬上處理.

<8>  工程師的耐心 :  這部份約佔整個 Linux 服務的 20% 強,  要有一個好的服務, 除了硬體, 線路, 套件外,  最重要的就是工程師的耐心,  因為以上的所有東西都是死的, 並不會自動裝成一套系統, 也不會自己處理問題, 所以一個有耐心的工程師就很重要了, 依照經驗來說一般的工程師在遇到問題的時候都會有點緊張, 因為若是提供 24hrs 服務的主機一當, 一定會接到粉多電話關切, 所以必需要在最短的時間內將狀況排除, 基本上來說可以依照以下的步驟來排除 :

1. 先判定是否是硬體的問題所造成 :
硬碟損毀, 主機版異常, Ram 有問題 ... 等
2. 再看是否為資源不足的問題所造成 :
頻寬被佔用, Ram 不足, Hdd 太小, CPU 滿載 ... 等

3. 再看是否有被入侵或者植入木馬 :
異常程式執行, 主機在攻擊別人網站 ... 等

4. 再查看是否為人為設定所造成的問題 :
Session 開太多,  Ram 分配太多 ... 等

以上是一些管 Linux  主機多年來經驗, 參考看看.

評論: 0 | 引用: 0 | 閱讀: 12985



[鄙雕兔這個人] [曾經] [發表的文] [做過的事] [電腦的問題]

[生活記載] [電腦手扎] [鄙雕留言專區]  [命理講義] --> 講義資料下載

[鄙雕兔的 2006 埃及行]