新聞動态

IT運維工(gōng)作(zuò)

2021-02-02 17:43:01 140
運維這個工(gōng)作(zuò)對于非運維崗位的人(rén)來(lái)講,一直都(dōu)是神秘的,大(dà)家對于運維的工(gōng)作(zuò)内容其實并不了解,或者了解的比較片面。其實算是一種工(gōng)作(zuò)類别了,除去(qù)互聯網軟件(jiàn)行業的運維人(rén)員(yuán)不說(shuō),一般的機(jī)關事(shì)業單位也有相(xiàng)應的崗位配置,即信息處,科(kē)技處之類維護單位IT系統的團隊,他(tā)們與互聯網公司的運維人(rén)員(yuán)工(gōng)作(zuò)有類似之處。這裡(lǐ)我主要介紹下國(guó)内互聯網公司的運維。

國(guó)内互聯網公司的運維工(gōng)作(zuò)大(dà)緻有以下幾個内容:1)資源管理(lǐ),2)變更部署,3)監控告警,4)故障響應;除去(qù)這4個必備的内容外,很多公司的運維還(hái)需要參與系統的架構設計(jì),推動系統性能,成本等優化以及系統安全等工(gōng)作(zuò)。

1.資源管理(lǐ)

資源管理(lǐ)其實最簡單的理(lǐ)解就(jiù)是機(jī)器的管理(lǐ),包括采購(gòu),規劃,調度等。對于開發團隊來(lái)說(shuō),他(tā)們不需要關心機(jī)器從(cóng)哪裡(lǐ)來(lái),隻需要找運維要機(jī)器就(jiù)好,運維會根據開發的需求給出相(xiàng)應的服務器資源。當然提到資源當然就(jiù)涉及到成本,運維人(rén)員(yuán)需要根據開發的業務重要程度合理(lǐ)的分(fēn)配資源,保證采購(gòu)回來(lái)的機(jī)器足夠使用。

2.變更部署

這個部分(fēn)其實包含的内容非常多而且也非常複雜,包括業務的部署,變更,發布,回退等等。先說(shuō)部署工(gōng)作(zuò),部署工(gōng)作(zuò)不僅僅是将開發生(shēng)産出來(lái)的軟件(jiàn)直接丢到機(jī)器上跑起來(lái)就(jiù)完事(shì)的,這裡(lǐ)需要運維解決環境問(wèn)題,比如(rú)系統,依賴(包括庫以及組件(jiàn)),網絡等等,否則服務無法正常運行。變更其實是制定規則的一個過程,對于互聯網公司來(lái)說(shuō),大(dà)多數故障都(dōu)來(lái)源于變更,開發上線程序,運維遷移數據等等。爲了降低變更的影(yǐng)響面,提高成功率,運維需要制定一系列的變更規則出來(lái),比方灰度時間間隔不能太短(duǎn),一次不能灰度太多機(jī)器等。

3.監控告警

除了基礎監控(cpu,内存,磁盤等)以及開發自(zì)己上報的監控外,運維人(rén)員(yuán)還(hái)需要對系統的關鍵部位安插告警點,對于敏感業務可(kě)能需要運維自(zì)己寫腳本進行更加細緻,及時以及定制化的監控以便及時發現和定位系統的異常

4.故障響應

這部分(fēn)是運維最常見(jiàn)的工(gōng)作(zuò),當系統發生(shēng)故障時,運維需要進行定位和修複,運維一般是進行系統級别的操作(zuò),比方切換網絡,切換機(jī)房(fáng)等。代碼層面的問(wèn)題需要配合開發一起解決。

以上工(gōng)作(zuò)屬于大(dà)多數運維人(rén)員(yuán)的基本工(gōng)作(zuò)内容了,運維即運營維護,運營層面需要做到以最低的成本做到高可(kě)用和高性能,維護層面需要最及時的發現系統問(wèn)題以及推動解決問(wèn)題。這個崗位需要的不僅是技術(shù),還(hái)需要一些管理(lǐ)能力,工(gōng)作(zuò)日(rì)常非常瑣碎,單個運維一般會對接多個開發。