職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
工作內(nèi)容
1.在公司AI系統(tǒng)解決方案制定、售前支持和項目落地中起到關(guān)鍵技術(shù)帶頭作用;
2.AI系統(tǒng)架構(gòu)設(shè)計:主導智算集群(GPU/TPU/NPU異構(gòu)計算)的系統(tǒng)架構(gòu)規(guī)劃,設(shè)計高吞吐、低延遲的計算與存儲方案,支持大規(guī)模模型訓練與推理場景。
3.性能深度優(yōu)化:從硬件(芯片互聯(lián)、內(nèi)存帶寬)、框架(PyTorch/TensorFlow)、算法(模型并行策略)全棧協(xié)同優(yōu)化,提升算力利用率(MFU)與能效比。
4.異構(gòu)計算生態(tài)整合:對接芯片廠商(如NVIDIA、華為昇騰等),完成驅(qū)動、固件、計算庫(CUDA/MindSpore)的適配與調(diào)優(yōu),解決跨平臺兼容性問題。
5.技術(shù)前瞻與落地:跟蹤AI芯片(如存算一體、光計算)、液冷技術(shù)等前沿方向,推動創(chuàng)新技術(shù)在智算中心的工程化落地。
任職資格
1.學歷與專業(yè):計算機科學、電子工程、應用數(shù)學等相關(guān)專業(yè)碩士及以上學歷,博士優(yōu)先。
2.核心能力
精通異構(gòu)計算架構(gòu)(GPU/TPU/FPGA),熟悉NVLink、RoCE、InfiniBand等高速互聯(lián)技術(shù)。
深入理解深度學習訓練/推理流程,具備PyTorch/TensorFlow框架底層優(yōu)化經(jīng)驗(如算子融合、顯存優(yōu)化)。
掌握C /Python,熟悉Linux內(nèi)核機制,能通過perf、Nsight等工具分析系統(tǒng)瓶頸。
了解分布式訓練框架(DeepSpeed、Megatron-LM)。
3.軟技能:
具備技術(shù)領(lǐng)導力,能統(tǒng)籌硬件、算法、運維團隊協(xié)同,輸出高質(zhì)量技術(shù)方案與專利。
加分項
具備高性能計算(HPC)或AI系統(tǒng)研發(fā)經(jīng)驗,有智算中心、云廠商AI平臺建設(shè)經(jīng)驗者優(yōu)先。
有AI芯片(如NVIDIA H100/H200、華為昇騰910B、沐曦、寒武紀、天數(shù)智芯、的適配與優(yōu)化能力)底層驅(qū)動或固件開發(fā)經(jīng)驗。
熟悉液冷系統(tǒng)設(shè)計、綠色數(shù)據(jù)中心能效優(yōu)化方案。
有千億參數(shù)模型訓練優(yōu)化經(jīng)驗者優(yōu)先。
截止日期:2027年04月08日
招聘人數(shù):1人
工作地點
地址:深圳南山區(qū)科發(fā)路3北門中國長城計算機集團公司內(nèi)
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
劉曉丹HR
中國長城科技集團股份有限公司
-
計算機硬件·網(wǎng)絡(luò)設(shè)備
-
1000人以上
-
公司性質(zhì)未知
-
長沙市經(jīng)濟技術(shù)開發(fā)區(qū)東三路5號

應屆畢業(yè)生
博士
2026-04-20 12:54:47
481人關(guān)注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
