科研动态

学院青枝团队第三期科研学习沙龙会

2025年05月30日              点击:

随着生成式人工智能的快速发展,大语言模型(LLM)已成为推动教育、科研和产业变革的关键技术力量。学Web3.0青枝团队于5月30日在学院9314教室举办了第三期科研沙龙。本次沙龙以“DeepSeek技术前沿与应用实践”为主题,聚焦大模型的技术架构、训练范式及其在行业中的应用路径,系统梳理了DeepSeek系列模型的关键机制与技术创新,为团队教师提供了高密度、高价值的知识储备。

会议由李释加老师主持,他首先简洁快速地介绍了当前大语言模型的发展趋势,逐一解析了其技术架构、训练范式、能力涌现机制及扩展法则,并概括了主流模型的技术背景与演化逻辑。详细讲解了DeepSeek开源大模型的系统架构与关键技术突破,重点介绍了MoE模型、推理蒸馏和Scaling Law等前沿方法。巫达勇老师则补充讲解了相关落地案例,围绕“DeepSeek R1在推理增强与开源生态中的技术价值”展开深入分析,并结合政务、医疗、司法、教育等应用场景,阐释了模型与实际系统之间的能力转化机制,强调了Prompt工程与RAG机制在场景融合中的关键作用。

348D9

在自由交流环节中,教师们就“如何在中小型团队部署DeepSeek V2/V3模型”及“思维链推理在教育场景中的适配策略”展开了深入讨论。大家一致认为,国产大模型正加速从“通用能力构建”向“行业适配落地”演进,其中混合专家模型(MoE)、推理能力迁移机制与Prompt控制体系将成为生态建设的关键支撑力量。围绕“基于RAG机制的教育任务自动生成”主题,团队拟与相关课题组开展联合实验,并推进模型试点应用工作。

讨论中,董川老师围绕数据构造策略与轻量化部署路径,分享了具有实际参考价值的建议。阳维国老师表示:高密度的技术+实战解析的沙龙会是团队各成员科研认知更新与交叉合作的重要土壤。建议团队可以继续追踪国内大模型体系的发展动向,特别是像DeepSeek这样具有自主开源潜力的技术体系,挖掘其在工程优化与场景联动方面可以横向研究的课题和应用。

5AA9C

本次沙龙会不仅及时传达了国内前沿模型技术的最新突破,也进一步增强了教师团队将大模型能力转化为研究成果的信心。通过交流与共识的凝聚,团队成员在模型部署思路、应用策略及跨学科融合路径上达成了多项启发性构想。未来,团队将持续推动对国产开源大模型的探索与验证,力求在教学创新、科研攻关和行业实践中取得更具实效的成果。




上一条:聚焦科研规划,共探创新方向 电子科学与技术系开展科研研讨活动 下一条:学院开展2025年程序设计竞赛指导教师座谈会共谋竞赛发展新篇章

关闭

Baidu
sogou