職位描述

職責(zé)描述:
-負(fù)責(zé)大規(guī)模ai計(jì)算集群基礎(chǔ)設(shè)施和產(chǎn)品在私有化場景下的設(shè)計(jì)與研發(fā)工作
-構(gòu)建異構(gòu)多芯計(jì)算集群,優(yōu)化gpu資源調(diào)度、虛擬化混布等核心能力,有效提升多芯供應(yīng)能力和集群資源效率
-基于標(biāo)準(zhǔn)kubernetes技術(shù),負(fù)責(zé)云原生ai組件研發(fā)工作,包括訓(xùn)練推理服務(wù)編排、gpu資源調(diào)度和混布、ai存儲、高性能網(wǎng)絡(luò)等
-基于ai計(jì)算集群基礎(chǔ)設(shè)施,設(shè)計(jì)和研發(fā)異構(gòu)計(jì)算平臺和解決方案,支持開發(fā)、訓(xùn)練、推理等多場景能力
-提升服務(wù)和產(chǎn)品的穩(wěn)定性,優(yōu)化服務(wù)性能和可擴(kuò)展性
任職要求:
-計(jì)算機(jī)及相關(guān)專業(yè),本科及以上學(xué)歷
-熟悉kubernetes工作原理,熟悉調(diào)度器、資源擴(kuò)展機(jī)制、容器運(yùn)行時(shí)、容器網(wǎng)絡(luò)等技術(shù),有kubernetes開發(fā)和維護(hù)經(jīng)驗(yàn)
-對kubeflow、volcano、pytorch、gpu芯片架構(gòu)有一定了解者優(yōu)先
-具備良好的溝通能力和團(tuán)隊(duì)協(xié)作精神,嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,注重工程質(zhì)量,有獨(dú)立解決各種系統(tǒng)問題的能力
-善于學(xué)習(xí)新的知識,動手能力強(qiáng),有強(qiáng)烈的責(zé)任心,喜歡鉆研技術(shù)
工作地點(diǎn)
地址:孝感


職位發(fā)布者
HR
百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司


-
互聯(lián)網(wǎng)·電子商務(wù)
-
1000人以上
-
私營·民營企業(yè)
-
北京海淀區(qū)上地十街10號百度大廈
相似職位