運維工程師
3-5.5萬元/月崗位職責
●Kubernetes運維–設計、運行并優(yōu)化AWS、GoogleCloud以及本地多集群的大規(guī)模
Kubernetes環(huán)境;根據(jù)需要擴展至Azure或OracleCloud。
●InfrastructureasCode–使用Terraform/Pulumi管理全部基礎設施,遵循GitOps工作
流。
●CI/CD–維護自動化構建與發(fā)布流水線,實現(xiàn)安全回滾。
●GPU集群管理–負責NVIDIA驅動、MIG分區(qū)、自動擴縮容及固件更新;如有需要,支持
AMDGPU。
●可觀測性–運營并擴展Prometheus+Grafana,制定SLI/SLO,并自動化容量監(jiān)控。
●事故響應–參與值班輪值,主導事后復盤,持續(xù)完善運行手冊。
●標準化與賦能–建立統(tǒng)一的SRE流程,向團隊傳授最佳實踐。
任職要求
●精通Kubernetes內(nèi)核及大規(guī)模集群運維,包含云端與本地部署。
●熟練掌握AWS和GoogleCloud;了解Azure或OracleCloud或Lambda、Nebius等
GPU云更佳。
●精通Terraform、GitOps工具(ArgoCD等)以及CI/CD流水線。
●深入理解Linux系統(tǒng)與網(wǎng)絡原理。
●具備NVIDIAGPU集群管理經(jīng)驗;熟悉AMD/ROCm體系者優(yōu)先。
●熟練使用Prometheus與Grafana棧并能應對大規(guī)模場景。
●良好的中英文書面與口頭溝通能力,能適應跨時區(qū)協(xié)作。

北京朝陽區(qū)CBD國際大廈
相關推薦查看更多 >
北京朝陽區(qū)網(wǎng)絡運維工程師。25一35歲。住場單位。
5000-7000元/月現(xiàn)場需要拿mac地址,裝終端軟件帶電腦,帶U盤
面議朝陽區(qū)
相同職位推薦
企業(yè)招聘
職位大全
相關搜索