服務(wù)器硬件運(yùn)維工程師
8000-10000元/月【崗位職責(zé)】
1、承擔(dān)高性能計(jì)算(HPC)平臺(tái)的硬件部署、軟件環(huán)境搭建及用戶(hù)支持相關(guān)工作。
2、執(zhí)行服務(wù)器的裝配、上架、線(xiàn)纜布置、系統(tǒng)安裝實(shí)施與驗(yàn)收測(cè)試,保障硬件系統(tǒng)穩(wěn)定運(yùn)行。
3、開(kāi)展計(jì)算集群中計(jì)算節(jié)點(diǎn)、GPU節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)等設(shè)備的日常巡檢、維護(hù)及故障處理。
4、完成超算環(huán)境中HPC軟件、仿真工具及科學(xué)計(jì)算類(lèi)軟件的編譯、部署與功能驗(yàn)證。
5、配合開(kāi)發(fā)與運(yùn)維團(tuán)隊(duì)推進(jìn)集群硬件資源和軟件環(huán)境的調(diào)度、擴(kuò)展及版本升級(jí)。
6、提供用戶(hù)技術(shù)支撐,響應(yīng)使用問(wèn)題,開(kāi)展基礎(chǔ)培訓(xùn),協(xié)助解決軟硬件應(yīng)用難題。
7、記錄設(shè)備更換、維修及測(cè)試過(guò)程,完善硬件資產(chǎn)臺(tái)賬與全周期管理文檔。
8、參與數(shù)據(jù)中心基礎(chǔ)設(shè)施支持任務(wù),包括電力配置、機(jī)房溫控、機(jī)柜布局等(依項(xiàng)目需求)。
【任職要求】
1、掌握高性能計(jì)算集群的硬件架構(gòu)與基礎(chǔ)軟件部署流程,具備較強(qiáng)實(shí)操能力與服務(wù)意識(shí)。
2、了解服務(wù)器硬件組成,熟悉CPU、內(nèi)存、主板、GPU、RAID、BMC等關(guān)鍵部件特性。
3、掌握主流服務(wù)器操作系統(tǒng)的安裝與基本配置,如CentOS、RockyLinux、UbuntuServer等。
4、掌握常見(jiàn)高性能計(jì)算軟件的編譯與部署方法,如Ansys、Gaussian、VASP、GROMACS、LAMMPS等。
5、具備網(wǎng)絡(luò)基礎(chǔ)知識(shí),了解InfiniBand、10G/25G以太網(wǎng)配置及鏈路故障排查方式。
6、掌握常用硬件診斷工具與檢測(cè)流程,具備服務(wù)器故障維修及部件替換能力。
7、熟悉或掌握Slurm、xCAT、OpenHPC、MPI編譯環(huán)境者優(yōu)先考慮。
8、熟悉或掌握容器化技術(shù)Docker、Apptainer(Singularity)者優(yōu)先考慮。
9、具備用戶(hù)支持經(jīng)驗(yàn),擁有良好的溝通協(xié)調(diào)能力、服務(wù)態(tài)度和團(tuán)隊(duì)協(xié)作精神。
10、具有計(jì)算集群、數(shù)據(jù)中心、科研機(jī)構(gòu)或超算中心工作經(jīng)驗(yàn)者優(yōu)先錄用。