其他技術職位
面議工作描述:
負責大規模自動駕駛計算下GPU中間層與運行時架構設計與優化,深入參與驅動層、CUDA/OpenCL運行時、調度器及內存管理模塊的研發
精通CUDA和OpenCL編程,能獨立完成高性能核函數(kernel)設計與優化,包括但不限于內存訪問模式優化、線程并行調度和寄存器/共享內存調優,優化passes,提升GPU計算效率與吞吐
在通用GPU(GPGPU)場景下開展性能剖析(profiling)、瓶頸定位與優化,熟練使用NsightCompute、Nsys、VulkanProfiler等性能分析工具完成GPGPU性能分析
設計并實現GPU排程策略,優化多流/多內核/異構算子調度;支持混合計算(CUDACore、TensorCore、DLA等)協同執行
構建端到端性能驗證與回歸測試體系,包含性能基準、自動剖析報告、回歸對比和A/B測試機制
任職要求:
計算機、電子工程、微電子或相關專業碩士及以上,3年以上GPU加速、編譯器或驅動研發經驗
精通CUDA(有長時間開發經驗),熟悉Warp調度機制、內存層次架構(global/share/local/constantmemory)等原理;熟練使用OpenCL或SYCL為加分項
掌握GPGPU性能優化技術:線程塊/網格調度、memorycoalescing、寄存器壓榨、內存對齊與數據布局設計、延遲隱藏、流水線調度、算子Fusion等
熟悉GPU調度機制及異步執行模型,具有多流、多優先級隊列、事件同步、計算圖經驗
熟悉GPU性能剖析工具(NsightCompute、Nsys、CUPTI、VulkanProfiler等),能獨立定位并解決性能瓶頸
加分點:
有RTX/Ampere/Orin/Xavier等NVIDIA下一代GPU或SoC平臺的實踐經驗;熟悉TensorCore、DLAPTX/SASS分析能力;
具備深度學習框架(TensorRT、TVM、MLIR)異構后端研發背景;
熟悉多維度算子Fusion、圖算子調度框架設計,或具備自定義算子編寫與打包部署能力。

北京海淀區中航科技大廈
相關推薦查看更多 >
招聘木門安裝工
面議招小工、砌磚石工
面議招面點白案師傅
6000-8000元/月海淀區
相同職位推薦
企業招聘