2014年3月11日 星期二

我在台北的工作總結


無論如何都到了向可愛的台北說再見的關鍵時刻了,我特此把近一年半的所有工作大項目列了張條列清單出來,以紀念在台北端工作的主要工作項目和所維繫的客戶內容。
大致上可以拆成兩部分,國科會的協助與非國科會客戶的協助。

國科會(科技部) 一年半重點協助項目清單

2012 年末
協助Core Switch C6509 汰換為 C6509E 上架設定並支援IPv6
Wifi 無線網路架構調查與設定與點位調整
國科會會內維運端所有例行性作業與系統、網路維護

2013 整年
汰換設備下架報廢程序 與 報廢磁帶處理
國科會雲端檔案管理系統的建置維運(資策會的eCloud) 與 教育訓練開課講師
VMWare的P to V (實體機轉為虛擬機)並納管與備份
Microsoft Exchange Server 2010 使用人大批匯入與各處室物件新增調整建立
Microsoft Exchange Server 2010 與 Outlook 2010 使用這終端測試協助
C6509E IPv4 轉 IPv6測試
Cisco PIX 更換為 Cisco ASA 5550 支援IPv6設定項目與各DMZ測試
新建置AP Web的相關SSL憑證申請作業
配合行政院 102年度網路攻防演練 不合格部份的協助處置與設定調整
國家資通安全會報 技術服務中心 GCB(Goverment Configuration Baseline)的Training和組態導入調整

2014 年初
建置MOST的相關新設備上架與設定
Cisco ACE 4710 LoadBalance IPv6 支援項目調整與測試
Cisco ACE 4710 LoadBalance 設定調整 - 增加多台設定項目
Wifi 1-2F 無線網路區段主幹速率升級調整100Mbps -> 1000Mbps
DNS 名稱解析調整 Mapping 新舊網域設定移轉 nsc.gov.tw轉為most.gov.tw
各Database與AP開發協商網址移轉與DNS Mapping測試

期他國科會(科技部)例行性支援的項目
Wifi Troubleshooting
Network Infrastructure Troubleshooting
每月月底的 Windows Server Hotfix / Update加班作業
每年年末的 大批申請待命班

其他客戶協助(非國科會、科技部的工作項目)

2013 整年
LV全台PC Upgrade案(DELL Global Project) - 全案約執行3-4個月(平均為1-1.5個人力)
Arris通用 骨幹網路調整(C4506改C3750X)設定
Arris通用 伺服器上架與設定作業
TAS台北美國學校的NAC還原
台北審計部PC升級作業
總統府國史館伺服器報修作業
吉鴻電子的伺服器報修作業
Nike機房搬遷作業兩次
空中大學伺服器上架與驗收
營建署伺服器設備上架與網路測試(道路、都計、水工三個組)兩個Site,分別在台北市八德路跟新莊副都心兩處
恆隆行機房建置案網路區塊負責人(使用Rukus)

2014 年初
Nike新增Cisco AP協助 與 員購店AP故障損壞報修處置
恆隆行伺服端設備上架協助(內湖端)

其他客戶的例行性支援項目(每月一次)
TAS台北美國學校的例行性MA (Core + WCS + WLC + 其他網路設備設定備份)
Arris通用例行性MA (Core + WCS + WLC + 其他網路設備設定備份)
Nike的例行性MA (檢查運作與燈號情況)


謹以此文記念在台北端的工作經驗。

VMWare 的進階功能說明描述


VMware HA (High Availability) 是各位 IT Manager 最喜愛的功能之一,原因是當 Cluster 內其中一部 ESX 伺服器發生故障,VMware HA 即時將所有 Virtual Machine 轉移到另外一部適合的 ESX 伺服器,然後重新啟動。

VMware vMotion 功能簡單來說就是將正在運行的 Virtual Machine 轉移到 Cluster 內其中一部 ESX 伺服器上,最好的例子就是當 ESX 伺服器需要作維護而停機,只要利用 vMotion 將所有 Virtual Machine 不停機地轉移,那就不會影響到公司運作。

VMware DRS (Distributed Resource Scheduler) 是一種在 ESX 伺服器高負荷環境下轉移適合 Virtual Machine 到 Cluster 內其中一部 ESX 伺服器,這個功能一定需要配合 vMotion 來使用。

以上資訊出自於http://www.hkitblog.com/部落客,文章內容與版權屬於該站站主所有,本人從該站引用,特此說明。


VMWare HA (High Availability) Operaion



上圖截自DELL官方網站,很清楚明白的闡述了叢集Cluster作完之後的狀態,硬體自有一套機制去控制哪台實體機能寫入DB,而當一台實體的Server掛點,會藉由健康監測機制去通報所有叢集區內的實體伺服器,而由他們去接手掛點Server的服務。


架構延展到虛擬化上面,例如上圖所示的Production Cluster,一定是成雙成對的實體機器(可能是兩台或是四台這樣),而這些實體機器可能透過各種不同的方式存取Database(iSCSI或是SAN架構),但是這些DB上面的資料肯定都是一致的。所以ESXi的安裝會橫跨在Cluster上面,但是VMWare實際資料會存在DB上,當任何一台實體伺服器掛點的時候,都不會影響現有服務運作,這就是HA(High Availability)

到這邊只能做到實體的HA,接下來可以談談虛擬的HA,也就是永不中斷的服務,例如網頁運作。對於一個不容許中斷服務的網站來說,我們需要Load Balance(負載平衡)的網路設備,例如Cisco ACE 4710,通常這種硬體設備很貴,用頻寬再算錢。但是它就能夠做到像是前端網址是www.most.gov.tw科技部首頁對映後台4台或更多的虛擬OS(Web Server),達到永不間斷的網頁服務,可能以輪循法或是負載偵測等等方式決定下一個連線的Session要連後面的哪一台Server,當任何虛擬OS掛點時,ACE會將他排除到服務名單中,可以自行設定檢測機制為何,當他服務恢復後,ACE會自動檢測後再將它排入服務輪循清單中。


所以這樣就能建置起一套從硬體到虛擬化完整的HA Solution,當然這些只是基礎中的基礎而已。

Database虛擬化就很難辦到了,因為I/O瓶頸速度跟VMWare並沒有人工智慧去判斷這台是DB須給予超高優先存取權跟較多的網路資源,所以MS-SQL Server裝在VMWare上是可行,但是並不實用。因此並沒有企業能夠做到100%的完全虛擬化,因為DB虛擬化的成本過高,除非實體伺服器全部使用SSD硬碟(提高實體I/O跟回應速度),還是有人這麼做,但是要價不斐。還有另外一種解決方案就是利用SSD作為Database的Cache,但是這就必須取決於第三方也就是SSD原廠的AP支援。

2014年3月10日 星期一

虛擬化的備份與還原策略


根據 How to follow the 3-2-1 backup rule with Veeam Backup & Replication本文,有以下三大原則,非常重要。

1. 同樣資料最好要有三份備份,這也是最低要求

2. 儲存媒介必須是兩種完全不同的媒介。根據此原則,你不能夠儲存磁帶兩次,或是擺在雲端兩次當作不同份的備份。

3. 至少保存一份資料在不同地理位置。因此,異地備份是非常重要的。

理想策略情況是:磁帶備份、異地備份、雲端備份同時存在,避免資料損失所造成的衝擊。
在成熟運轉的企業環境中,備份與HA(High Availability)同等重要,在災難還原演練當中,兩著都扮演著不可或缺的角色。

接下來是還原計畫,還原就相對單純的多,但是先有還原才有備份,必須先確定還原需要哪些資料確保還原成功,才開始估算要備份下多少資料。如果還原測試不能夠確實演練,備份將會流於形式上的運作,因為無法確定這項備份能夠被還原就是無效備份。

還原要點有以下各點:

1. 還原的資料的時程估算,這通常可以理解為歷史資料的平均,然後加上人為操作的時間去估計需耗掉多少時間。

2. 步驟先後順序。如果這是一個區域性的大災難,那我們必須要先起哪些服務,例如:從實體設備購置,到作業系統還原,資料復原計劃,還原原有服務的順序如何備執行,哪些可以同時間被執行,通常必須包含硬體跟軟體兩個大範圍。

3. 服務可以忍受被中斷的時間。當一間企業並不能忍受這樣的服務被中斷時,應該考慮HA機制,而不是更快的還原計畫,畢竟還原計畫再快也是需要人去執行,而不是全自動化。

根據以上資訊就能打造出一系列的備份還原SOP,而且是高可用與高可靠性的,當然,評估這些計畫往往幾落實花上更多的時間,希望以上的解釋會對企業MIS有所幫助。

2014年2月27日 星期四

CISSP領域重要名詞釋疑 - 案例學習:避免風險 與 定性定量風險分析


案例學習:避免風險

有一間公司在線上銷售Apple iPods。基於安全考量,每一次客戶進行購買都需要重覆輸入信用卡密碼。這麼作可以避免存儲信用卡資訊在網際網路上的風險(例如他們可能更容易被盜)。
基於客戶的反饋,再重複購買的客戶裏面有有可以提供”儲存我的信用卡資訊”功能。一旦新功能被提出伴隨著就是風險分析的評估,該事業群也會記算投資回報此功能的比率。風險分析表示,信息安全架構需要顯著改善,以安全的面對網際網路系統存儲信用卡資訊。

這樣做還必須要更嚴格的支付行業(PCI)的審議,增加相當數量的人員工作時間,並且增加TCO的總成本。

一旦所有所有費用都被記錄下來,該TCO超過兩倍的投資回報率。該公司決議為了避免風險,並沒有實現儲存信用卡資訊的功能。

定性與定量風險分析

定量與定性風險分析為風險分析的兩種方法。

定量的風險分析使用的是硬性的單位,例如:美元。定性的風險分析使用的簡單的近似值。定量是比較客觀的,而定性比較主觀。

考試警訊

定量的風險分析要求你去計算你所要保護的資產。定量是考試時必須謹記的重點。

統計ALE(年度預期損失)就是一個定量風險評估的例子。輸入ALE有兩個重要的數字:AV(固定資產)美元計價,風險因素(以百分比顯示)和年發生率(硬數字)。

在風險分析矩陣當中,就是一個定性的風險分析案例。可能性和後果是比較粗糙的值,範圍從1-5。真對一個有一定程度風險的事件很容易發生給與4或5的辯論。

定量風險分析是比較困難的:定量風險分析的地震破壞數據由於地震中心提供,你需要計算資產數據中心的價值:建築成本,伺服器,網絡設備,計算機機架,顯示器等,然後計算出曝光係數,依此類推。
定性分析同樣的風險,你會研究的風險,並同意該可能性是2,而其後果是4,並使用風險分析矩陣確定的風險“高”。

2014年2月13日 星期四

CISSP領域重要名詞釋疑 - 風險接受的準則 降低風險 與 轉換風險


風險接受的準則
低可能性與影響小的風險可以被風險評估接受。高頻率與影響範圍大的風險不能被接受。這裏有些案例,例如立法規定和法規規範的數據保護或,危害人類生命或安全的,這些風險接受就不會成為選項

降低風險
降低風險意味著將風險降低到可以被接受的程度。在筆記型電腦加密的案件中,年前預期損失部分給與加密就是風險減輕的例子。筆記型電腦被盜所損失的個人資料資訊通過加密數據獲得緩解,風險並未消除到安全:過弱的密碼或是可能暴露的個資,但風險已經降低到一個可以接受的水平。

在某些案例中,風險可以被完全的消除,這就是所謂的消除風險

轉換風險
轉換風險是一種”保險模式”。就像多數人並不承擔房子火災風險,而由保險公司去承擔,保險公司是由專家在作風險分析,買入風險是他們的事。如果發生火災的年平均貨幣分險,每1000家為$500,000($500/house),他們出售1000家火災的保單是$600/year,則他們會有20%的利潤。當然前提是他們已經正確的評估出風險。

關於AP IOS升降版初始化找不到tftp server的問題


昨天在Nike與公司環境都有發生過初始化AP的問題,以下針對AP開機按住Reset Button將預設IP設定回10.0.0.1,卻無法連上同網段Tftp Server時提供解決方式。

以下幾行為在AP上進行設定的關鍵指令,請參考
debug capwap console client
debug capwap client no-reload

archive download-sw /overwrite tftp://10.66.74.250/ap3g2-k9w7-tar.default
最後一行請改成相對應的邏輯路徑,AP即可利用IP位址從Tftp Server端下載指定的IOS。