本文详细记录了我参加 AscendC Erf 算子优化比赛的全过程,包括从 CUDA 到 AscendC 的概念迁移、Erf 近似公式选择、Direct/Medium/Large 三路径分治策略、UB 布局优化,以及比赛过程中积累的踩坑经验。虽然最终没有进入决赛,但过程本身收获很大。