Skip to content个人信息
个人能力与品质
思想道德立场正确
- 坚定拥护中国共产党领导,严守政治纪律,在思想上、政治上、行动上与党中央保持一致。
组织能力与团队协作能力
- 初高中阶段曾担任班长、学习委员等职位。
- 现担任学委、学生会委员、计算机学院超算与并行计算团队队员。
积极向上、乐观进取、热情开朗
- 习惯以乐观视角看待问题,倾向于从问题和错误中总结经验、持续改进,而不是在挫折中停滞不前。
学习品质
挑战精神、探索精神、钻研精神、抗压能力与学习习惯
- 大一上参加计算机学院超算与并行计算团队特殊招新。在缺乏相关领域经验的基础上,针对给出的串行矩阵乘算法进行优化。
- 面对技术栈陌生、英文文档阅读困难、环境配置频繁报错、程序运行问题接连出现等挑战,能够及时调整状态、拆解问题并制定合理解决路径,在失败中学习,在学习中不断迭代。
- 最终通过资料收集、文档阅读、实践验证和持续纠错,以 10 倍加速比 的成绩获得特招题第一,并顺利通过复试。
- 在学习过程中同步进行文档创作,对学习内容进行记录、梳理与沉淀,部分学习文档已发布在个人博客中。
项目实践经历
基于异构平台的卷积算子优化
- 时间:2025.03.08 - 至今
- 项目简介:项目选自全国大学生计算机系统能力大赛智能计算创新设计赛(先导杯)多模态大模型卷积算子优化赛道,要求在国产 DCU 上采用异构加速技巧优化卷积算子,提高算子计算速度与响应效率,加快多模态大模型训练过程,重点关注半精度浮点数在异构计算平台上的性能表现。
- 承担工作:检索并阅读 im2col 算法相关文献,理解其核心思想并完成代码转换;将四维输入特征图转换为二维张量,与转换后的卷积核进行矩阵乘运算,再将结果重构为特征图输出。
- 项目成果:通过转置等优化手段提升数据局部性、减少访存开销,从而提升卷积运算整体效率。当前方案已实现 5.65 倍加速比(10641us / 1882us)。后续将继续围绕 Implicit GEMM 算法、并行计算优化与硬件架构适配展开研究,进一步挖掘算子在异构环境下的性能潜力。
基于 MPI 并行计算程序接口的一维粒子随机运动模拟
- 时间:2025.02.12 - 2025.02.13
- 项目简介:项目选自 MPI Tutorial,使用 MPI 并行计算程序接口并行化模拟一维粒子随机游走问题(Random Walk)。项目难点在于边缘粒子的检测与收集、边缘粒子传输策略以及数据竞争问题的处理。该项目是一类复杂粒子模拟模型的一维简化实例,对其理解与复现有助于加深对并行程序共通行为的认识,并为后续高维复杂粒子随机运动模拟模型的构建奠定基础。
- 承担工作:理解一维粒子随机运动机制并完成模型构建,基于 MPI 对程序进行并行化;通过对进程序号进行奇偶划分来控制数据发送与接收顺序,解决传输过程中的数据竞争问题,避免死锁出现。
- 项目成果:完整复现目标功能,并在原有基础上扩展实现程序结构检测、粒子信息可视化反馈等功能,使模拟结果更加直观、便于分析。
基于太初加速卡平台的卷积前向传播算子优化
- 时间:2024.10.20 - 2024.12.15
- 项目简介:项目选自 2024 年开放原子大赛 Tecorigin 算子开发任务挑战赛决赛赛题,要求在国产太初 AI 加速卡上使用 SDDAC 开发语言对卷积前向算子进行异构开发,提升算子在特定硬件平台和多核、多线程环境下的计算性能与执行效率,加速数据处理、数学计算及图像处理等相关任务。
- 承担工作:负责团队任务划分、进度管理和沟通协调,保障成员高效协作并推动项目顺利推进;在具体优化阶段实现循环展开、冗余结构处理、访存优化等关键技术,提升算子的计算效率与执行速度。
- 项目成果:经过持续优化与实验,成功将单次卷积前向传播算子运行时间压缩至 65ms,项目最终获得比赛 全国第 26 名。