浙江大学：2025年DeepSeek之火可以燎原报告（56页）.pdf

定制报告-个性化定制-按需专项定制研究报告

行业报告、薪酬报告

联系：400-6363-638

《浙江大学：2025年DeepSeek之火可以燎原报告（56页）.pdf》由会员分享，可在线阅读，更多相关《浙江大学：2025年DeepSeek之火可以燎原报告（56页）.pdf（56页珍藏版）》请在薪酬报告网上搜索。

1、DeepSeek之火可以燎原浙江大学DeepSeek系列专题线上公开课报告提纲从中华文化基因看DeepSeek成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯图片来源https:/ https:/ 牛meat 肉beaf 牛肉fly 飞airplane 飞机machine 机器英语发展简史维克多-D.O.-桑托斯汉语的高效和可传承图片来源 https:/ 搭积木，知识迁移现代常用字3700康熙字典46933甲骨文+金文5000存量增量中华字海8.5万生僻字，含古字5万0年几乎为维克多-D.O.-桑托斯DeepSeek与

2、ChatGPT训练语料对比ChatGPT 4DeepSeek 总语料规模 13万亿token 英文语料占比约92.6%,主要来源于互联网公开文本，包括维基百科、新闻报道、书籍、学术论文、程序代码等中文语料占比仅约0.1%，来源单一，学术文献不足，中文互联网内容（如社交媒体、论坛）噪声较多，需复杂清洗总语料规模：14.8 万亿 token，涵盖多语言、数学、编程等领域，其中 87%代码、10%英文、3%中文中文语料特点：有约 2.3 亿字精校的古典文献；覆盖网络文学、社交媒体、学术论文等现代文本；通过“千字文”式分词算法增强对成语、典故理解数据处理技术：过滤机制：采用多层净化技术（如

3、“八面受敌法”），数据噪音剔除精度达 99.7%。分词优化：结合古典语法与现代汉语的分词算法，使成语理解准确率提升 38%。长上下文支持：通过两阶段扩展训练，将上下文窗口扩展至 128K，增强长文本处理能力。维克多-D.O.-桑托斯用汉字进行模型训练将在这场AI之争中胜出？中文:英文DeepSeek 1:3.33 ChatGPT 1:900 维克多-D.O.-桑托斯大力出奇迹的范式增加参数增加数据提升性能增加算力增加算力算力性能AI垄断产业垄断思想禁锢学术垄断AlexNet18FLOPsBERT-Large20FLOPsGPT323FLOPsGrok32FLOPsGPT-4o27FLOPs维克

4、多-D.O.-桑托斯中华民族的不屈不挠精神我命由我不由天若前方无路我便踏出一条路DeepSeek的技术突围打破CUDA标准库壁垒，为非英伟达算力芯片提供机会采用思维链提升逻辑性能，实现模型的顿悟时刻知识蒸馏+MOE，证明小规模高质量数据远胜低质量大规模数据算力优化算法革新架构创新人工智能三要素报告提纲从中华文化基因看DeepSeek的成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯争议一：知识蒸馏是抄袭还是创新知识蒸馏（Knowledge Distillation）是一种模型压缩和加速技术，旨在将大型模型（教师模型）的知识

5、迁移到小型模型（学生模型），在减少计算资源消耗，缩短推理时间的同时，尽可能达到接近大型模型的性能。知识蒸馏的实现过程怒发冲冠凭栏？借？维克多-D.O.-桑托斯争议一：知识蒸馏是抄袭还是创新牛顿第一定律：如果一个物体所受合外力为0，那么这个物体将保持静止或匀速直线运动牛顿第二定律：物体的动量随时间的变化率与受力成正比。牛顿第三定律：相互作用的两个物体之间的作用力和反作用力大小相等，方向相反，作用在同一条直线上。牛顿三大定律我也知道，所以这些定律是我发现的何为抄袭和剽窃?维克多-D.O.-桑托斯争议一：知识蒸馏是抄袭还是创新基于牛顿定律等物理实现航天器制造零件机械式机床数控式机床何为创新?维克多-

6、D.O.-桑托斯争议一：知识蒸馏是抄袭还是创新。维克多-D.O.-桑托斯无情吞噬地球资源的黑洞争议二：人工智能是资源黑洞还是效率革命Grok320万H1002千H800智能决策提高效率低能耗来源：https:/ 2025年2月18日VS报告提纲从中华文化基因看DeepSeek的成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯AI的道与术从哪里来？人工智能到哪里去？维克多-D.O.-桑托斯AI的道与术堆量不堆质商高定律：记录在公元前1世纪左右编写的周髀算经。商高与周公的对话中提及：“故折矩，勾广三，股修四，经隅五。”大道至简

7、道德经：有道无术，术尚可求也，有术无道，止于术。道是规律、道理和本源，而术则是指具体的方法和技巧。这句话告诉我们在解决问题时，只有掌握了事物发展的规律，才能更好地寻求技巧和方法，而只有真正理解和掌握了“道”和“术”，才能更好地应对各种问题，举一反三，不断取得成功道不足则多术维克多-D.O.-桑托斯AI的道与术道德经.第四十二章：道生一，一生二，二生三，三生万物。万物负阴而抱阳，冲气以为和。易经系辞：形而上者谓之道，形而下者谓之器。何为道？维克多-D.O.-桑托斯AI的道与术道生一智能维克多-D.O.-桑托斯AI的道与术道生一一生二智能智：为阴，即心智，内心之所思所想，即人工智能的算法能：为阳，

8、即行动，外在的表现，即人工智能带给我们的能力扩展智能维克多-D.O.-桑托斯AI的道与术道生一一生二能智二生三智能智：为阴，即心智，内心之所思所想，即人工智能的算法能：为阳，即行动，外在的表现，即人工智能带给我们的能力扩展智+能+伦理安全，才是最完美的人工智能，这个伦理安全就是需要解决的三三生万物智能道生一，一生二，二生三，三生万物。万物负阴而抱阳，冲气以为和。维克多-D.O.-桑托斯AI的伦理安全与道德困境电车困境紧急情况左转撞死一人功利主义直行撞死多人康德道义自动驾驶车上乘客路上行人紧急情况VSVS维克多-D.O.-桑托斯AI的算法偏见和统治只有算法的不是人工智能有了算法也能行动的也还不是

9、真正的智能只有能落地应用给人类带来美好生活的人工智能才是真正的人工智能超过20分钟罚款20分钟不到20分钟奖励超过18分钟罚款不到18分钟奖励强化学习18分钟图片来源：百度维克多-D.O.-桑托斯阴阳气和是人工智能的一条发展之道机器人三守则，机器人能做到吗？我们该把人工智能当工具还是人？当个人隐私与公共安全冲突时，该如何选择？人工智能是否会造成教育不公？面对AI的算法统治和偏见怎么办？不同种族和宗教信仰的人群又如何达成伦理共识？AIGC幻觉是不是造假？通过AI换脸进行诈骗该如何杜绝？学术诚信如何防范？.能智问题的根源基于0-1的布尔代数建立起来的系统只有阴阳，非阴即阳现实世界系统非阴非阳，阴阳

10、气和二生三，三生万物找到这个三，找到这个气智能报告提纲从中华文化基因看DeepSeek的成功之道DeepSeek私有化应用方法DeepSeek的二点争议关于人工智能未来发展之路的思考维克多-D.O.-桑托斯增强本地DeepSeek能力的二个方案针对特定任务或领域定制，显著提高任务性能适应特定领域的细微差别、语气或术语依赖足够高质量标注数据适合目标任务明确、数据相对静态的场景微调Fine-tuning利用外部知识库增强答案提供支持性的证据能够动态检索相关知识适合数据频繁更新的场景成本效益高更可信、更可解释、时效性和准确性高检索增强生成Retrieval-Augmented Generatio,R

11、AG通过精心设计输入提示，引导LLM生成期望的高质量输出无需重新训练模型，不需要标注数据一些提示工程框架可以显著增强LLM的推理能力灵活性、使用简单提示词工程Prompt Engineering训练实习生提供项目资料任务布置清晰维克多-D.O.-桑托斯本地部署检索增强-RAGUI界面维克多-D.O.-桑托斯本地部署检索增强-RAGUI界面API接口维克多-D.O.-桑托斯本地部署检索增强-RAGUI界面API接口基座模型DeepSeek系列LLaMA系列嵌入模型BGE-M3embed-qa-4维克多-D.O.-桑托斯本地部署检索增强-RAGUI界面API接口基座模型DeepSeek系列LLaM

12、A系列嵌入模型BGE-M3embed-qa-4知识库TXTDOCXXLSXHTMLPDFEPUBPPTCSV维克多-D.O.-桑托斯RAG部署过程1、下载安装OLLAMA：https:/ Studio：https:/cherry- pull deepseek-r1:7b4、下载嵌入模型：Ollama pull bge-m3:latest维克多-D.O.-桑托斯RAG部署过程-配置OLLAMA接口382 激活Ollama接口3 管理模型DeepSeek模型词向量化模型1 打开配置5、配置Cherry Studio指定Ollama API维克多-D.O.-桑托斯RAG部署过程-管理OLLAMA模型

13、391 管理模型2 加入DeepSeek3 加入词向量化模型6、管理Ollama 模型维克多-D.O.-桑托斯RAG部署过程-管理知识库401 打开管理界面3 选择向量化模型4 输入知识库名字2 添加新知识库5 保存维克多-D.O.-桑托斯RAG部署过程-知识库向量化411 选择知识库3 等待向量化2 添加文件维克多-D.O.-桑托斯RAG部署过程-对答421 开启对话4 输入问题3 选择知识库2 选择模型5 输出答案维克多-D.O.-桑托斯关于Ollama的安全报告43https:/ LoRA（Low-Rank Adaptation of Large Language Models）的核心思

14、想是通过仅训练低秩矩阵，然后将这些参数注入到原始模型中，从而实现模型的微调，这种方法显著减少了所需的训练资源，特别适合在资源有限的环境中使用。经过LoRA微调后的参数会覆盖原来基础模型的部分参数，因此模型的参数规模不会改变，但是输出已经跟专业数据对齐了LoRA训练基础模型参数训练参数BaseModel维克多-D.O.-桑托斯大模型微调的二种技术LoRA45 LoRA（Low-Rank Adaptation of Large Language Models）的核心思想是通过仅训练低秩矩阵，然后将这些参数注入到原始模型中，从而实现模型的微调，这种方法显著减少了所需的训练资源，特别适合在资源有限的环

15、境中使用。经过LoRA微调后的参数会覆盖原来基础模型的部分参数，因此模型的参数规模不会改变，但是输出已经跟专业数据对齐了LoRA训练基础模型参数训练参数冻结训练维克多-D.O.-桑托斯大模型微调的二种技术Backbone46Backbone训练基础模型参数训练参数 Backbone微调就是通过设计一个专业的骨架模型，这个骨架模型可以是不同类型的深度神经网络，如MLP、CNN等，但是参数较小。将这个骨架模型装载在基础模型的输出端，在微调训练时，基础模型的参数冻结，只训练骨架模型。这种微调的方法非常实用，不同的骨架模型完成不同的专业场景任务，推理的时候，只需要切换不同的骨架模型。就好比一个专业的摄

16、影师通过更换不同的镜头和滤镜完成专业水平照片的拍摄。BackboneBaseModel维克多-D.O.-桑托斯大模型微调的二种技术Backbone47Backbone训练基础模型参数训练参数 Backbone微调就是通过设计一个专业的骨架模型，这个骨架模型可以是不同类型的深度神经网络，如MLP、CNN等，但是参数较小。将这个骨架模型装载在基础模型的输出端，在微调训练时，基础模型的参数冻结，只训练骨架模型。这种微调的方法非常实用，不同的骨架模型完成不同的专业场景任务，推理的时候，只需要切换不同的骨架模型。就好比一个专业的摄影师通过更换不同的镜头和滤镜完成专业水平照片的拍摄。冻结训练维克多-D.O

17、.-桑托斯轻代码微调方法-基于LLaMA-Factory481、LLaMA-Factory的安装部署：git clone https:/ install-upgrade pip pip3 install bitsandbytes=0.39.0 进入LLaMA-Factory目录中，执行pip3 install-e.torch,metrics3、LLaMA-Factory的主要子目录说明 config：存放自定义模型训练脚本 data：存放示例的训练数据集样本，采用json格式 examples：存放示例的训练脚本，包括train_full、train_lora、train_qlora、infe

18、rence（推理）、merge_lora（模型合并）saves：微调模型临时存放目录 models：模型合并临时存放目录维克多-D.O.-桑托斯轻代码微调方法-基于LLaMA-Factory494、训练模版制作在examples目录下找到train_lora子目录，复制llama3_lora_sft.yaml文件的一个备份，进行修改，重新命名，比如deepseek_lora.yaml，存放到config目录中维克多-D.O.-桑托斯轻代码微调方法-基于LLaMA-Factory505、修改模板(deepseek_lora.yaml)的训练参数，根据自己的项目修改相应的参数，几个主要的参数说明

19、如下：联系邮箱：维克多-D.O.-桑托斯轻代码微调方法-基于LLaMA-Factory516、将训练的数据集拷贝到data目录下，并修改dataset_info.json文件，增加数据的索引7、训练：执行命令 llamafactory-cli train deepseek_lora.yaml 即可开始训练维克多-D.O.-桑托斯DeepSeek本地微调的简单应用52deepseek-r1:32b选择题思考过程自测选择题选择推理模式AI智能助教维克多-D.O.-桑托斯DeepSeek本地微调的简单应用53推理模式答疑模式我现在有点发热，咳嗽3天，38度，应该怎么办？推理过程AI智能助教维克多-D.O.-桑托斯智能助教系统与虚拟仿真实验室的集成医学院基础医学实验教学中心一体式机能智慧教学实验室维克多-D.O.-桑托斯展望走一条属于中国的AI之路55总有一天，我们将会用AI技术揭开推背图、梅花易数的神秘面纱也许人工智能正走在不断论证中医和周易的路上感谢聆听敬请批评指正