主办单位: | 嘉兴市工业领域生产性服务业促进中心 | 师资信息 | 杨俊 |
---|---|---|---|
联系人: | 张建新 | 联系电话: | 13732596234 |
开班时间: | 2025-05-24 | 开班地点: | 嘉兴银行总行二楼嘉银学院教室3(嘉兴市昌盛南路1001号) |
培训科目: | 培训人数: | 40 |
第一部分、Deepseek的定位与行业意义
1. Deepseek的背景与发展历程
- 公司/项目起源:成立时间、核心团队、使命与愿景
- 技术定位:聚焦领域(如AGI、垂直行业大模型、高效训练等)
2. 为什么关注Deepseek?
- 全球AI竞争中的中国代表性力量
- 技术突破对行业生态的潜在重塑
第二部分、Deepseek的技术创新与底层逻辑
1. 模型架构创新
- 核心架构:深入浅出对比对ChatGPT的基础模型Transformer的改进
- 性能突破:更低的训练成本、更高的推理效率(示例:单位算力下的性能提升)
2. 训练方法与算法优化
- 数据高效利用:小样本学习、合成数据生成
- 训练框架创新:分布式训练优化、混合精度策略
3. 数据处理与知识注入
- 多模态数据融合:文本、代码、行业数据的联合训练
- 领域知识增强:垂直行业(金融、医疗等)的定向优化
4. 算力效率革命
- 模型压缩技术:从千亿参数到百亿参数的轻量化部署