分享
OUC新芽训练营
输入“/”快速插入内容
OUC新芽训练营
🎯 关于新芽训练营
最近看了南开大学戴一冕老师的朋友圈,目前 CCF SPP 新芽正在征集全国范围更多的试点院校,欢迎感兴趣的老师同学联系。和他联系了下,他给我介绍了下2025年CCF学生领航计划(SPP)换届,由程明明老师主要负责。“新芽训练营”以前是程明明老师课题组内部培养本科生的一套流程,主要面向低年级本科生,用于培养和选拔学有余力并有志于进组实习的科研后备人才。
目前这个计划在全国推广,从大一开始培养优秀的科研人才,目前还没有正式的文档或者资料,但网站和APP正在开发中计划明年上线。
我加了“新芽训练营”的群,观察了一段时间,发现这样的打卡模式也非常好,可以考虑在中国海洋大学推广。那么为什么不同从现在开始呢?好吧,让我们现在开始吧!
⛳️ 目标与投入
新芽训练营旨在于选拔并培养具有坚韧的意志品格、强烈的科研兴趣、出色的学习能力的同学,并为之提供为期数年的科研培育,不卡学校档次,也不关心年级排名。对于成功完成新芽训练的同学,会提供专业的生涯规划指导,并在优秀导师的指导下开展科研工作、参与各类竞赛。
与此同时,我们也要求参与实习的同学,必须是学有余力的,能够保证实习时间,原则上周六周末和寒暑假大多数时间都需要投入到实习相关工作之中。
⭐️ 两阶段培养
目前,新芽训练营共有两个阶段,分别是“播种期”和“培育期”。
第一阶段:播种期
在第一阶段“播种期”,我们要求申请人从给定的论文主题集合中挑选 1 个,每个主题包含 10 篇以上工作。选定主题后,申请人需要每周打卡汇报上一周的学习进展,若长期缺席,则视为自愿放弃并从训练营中移除。请勿使用与新芽训练内容无关的内容或者大模型生成的内容来搪塞打卡、凑够打卡次数,我们有核查机制,万事诚信第一。摘录一位同学的打卡内容以作示范:
⚽
本周打卡:
按照李沐老师课程的顺序回顾了上学期中已学习过的一些简单的神经网络的内容:从最基本的线性回归开始,到softmax回归,多层感知机和CNN中最基础的知识且又动手从零开始构建过。在回顾的过程中收获颇丰,不仅加深了记忆,也对当时遗留下来的一些问题又有了一些新的理解。同时最初步的阅读了一下所选主题中一篇关于LoRA的论文,从论文中了解到随着模型规模的不断增大,全参数微调变的不再可行,取而代之是LoRA的思想:冻结原矩阵,引入一个可训练的矩阵并对其进行低秩分解以只训练较少的参数。
下周目标:
继续推进李沐老师的课程的学习;学习论文中所提到的Transformer架构以及其前置知识;继续理解这篇论文的公式及其原理。
打卡满 12 次且打卡率超过 85% 的同学可以申请结业口头汇报,包含至少 4 篇研究工作(综述论文除外)的详细阅读与技术细节梳理,其中 3 篇来自该主题集合,1 篇可由申请人自主从互联网上搜索该主题上最新发布/发表的重要论文。播种期结题汇报的质量,请至少对齐往届同学,示例如下:
•
通用架构 or 绑定下游?浅谈多模态图像融合的发展(
https://www.bilibili.com/video/BV189JizDEvw/
)
•
Large Language Model Agent (
https://www.bilibili.com/video/BV1bLJizmE9D/
)
•
从线性叠加到语义融合:mixup 技术的演进 (
https://www.bilibili.com/video/BV1jg4y1f7Vj/
)
需要提醒的是,我们分配的论文阅读任务在数量和难度上都颇具挑战,相当于一次研究生 Seminar 汇报的工作强度。推荐申请者自学来夯实基础。
第二阶段:培育期
播种期结业答辩会有评委打分,均分大于 85 的同学进入第二阶段培育期,重点培育和考察动手编程的能力,此阶段会有组内的老师和研究生给与适当的指导和答疑。我们希望申请者能够整理研究生提供的 baseline 代码,将某些论文里的创新模块,迁移到 baseline 里。观察模型性能是否有提升。如果计算资源有限,用少量数据训练即可,对实验过程、代码框架进行记录与展示。
🔥海大试行阶段与SPP的不同之处
结合目前海大老师、学生的实际情况,我们也对训练内容进行了一些调整:
1.
论文主题有修改:选择了一些类别,并结合 OUC AI Lab 的研究领域增加了一些类别。
2.
学习资料有修改:学习资料在本书第二章给出。
3.
第二阶段培育期,改为针对baseline进行编程,以及改写。
💡 联系方式
本文档内容仍在不断更新中,有任何问题,欢迎随时联系:
gaofeng@ouc.edu.cn