運(yùn)維工程師
3-5.5萬元/月崗位職責(zé)
●Kubernetes運(yùn)維–設(shè)計、運(yùn)行并優(yōu)化AWS、GoogleCloud以及本地多集群的大規(guī)模
Kubernetes環(huán)境;根據(jù)需要擴(kuò)展至Azure或OracleCloud。
●InfrastructureasCode–使用Terraform/Pulumi管理全部基礎(chǔ)設(shè)施,遵循GitOps工作
流。
●CI/CD–維護(hù)自動化構(gòu)建與發(fā)布流水線,實現(xiàn)安全回滾。
●GPU集群管理–負(fù)責(zé)NVIDIA驅(qū)動、MIG分區(qū)、自動擴(kuò)縮容及固件更新;如有需要,支持
AMDGPU。
●可觀測性–運(yùn)營并擴(kuò)展Prometheus+Grafana,制定SLI/SLO,并自動化容量監(jiān)控。
●事故響應(yīng)–參與值班輪值,主導(dǎo)事后復(fù)盤,持續(xù)完善運(yùn)行手冊。
●標(biāo)準(zhǔn)化與賦能–建立統(tǒng)一的SRE流程,向團(tuán)隊傳授最佳實踐。
任職要求
●精通Kubernetes內(nèi)核及大規(guī)模集群運(yùn)維,包含云端與本地部署。
●熟練掌握AWS和GoogleCloud;了解Azure或OracleCloud或Lambda、Nebius等
GPU云更佳。
●精通Terraform、GitOps工具(ArgoCD等)以及CI/CD流水線。
●深入理解Linux系統(tǒng)與網(wǎng)絡(luò)原理。
●具備NVIDIAGPU集群管理經(jīng)驗;熟悉AMD/ROCm體系者優(yōu)先。
●熟練使用Prometheus與Grafana棧并能應(yīng)對大規(guī)模場景。
●良好的中英文書面與口頭溝通能力,能適應(yīng)跨時區(qū)協(xié)作。

北京朝陽區(qū)CBD國際大廈
相關(guān)推薦查看更多 >
北京朝陽區(qū)網(wǎng)絡(luò)運(yùn)維工程師。25一35歲。住場單位。
5000-7000元/月現(xiàn)場需要拿mac地址,裝終端軟件帶電腦,帶U盤
面議朝陽區(qū)
相同職位推薦
企業(yè)招聘
職位大全
相關(guān)搜索