sanyinjiang
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

KTransformers部署DeepSeek-R1-Q4_K_M

一、参考文档与信息说明 KTransformers 是由清华大学发起的一个项目,它利用 DeepSeek 模型的 MoE 架构特性,将专家模型的权重加载到内存上,并分配 CPU 完成相关计算,同时将 ML/KV Cache 加载到 GPU 上,从而实现 CPU+GPU 混合推理。这种方法能够在最大化降低显存占用的同时,保持一定的推理速度。KTransformers 项目旨在解决大模型本地
2025-03-12
大模型
#KTransformers

跟随《大语言模型-赵鑫教授团队》入门大语言模型

一、课程学习内容与打卡要求 https://www.datawhale.cn/learn/summary/107 二、正式课程内容 2.1 第一课 初识大模型 2.1.1 语言模型的发展 ChatPGT于2022年11月底上线,引爆全球关注。 image-20250311222953477 语言模型通常是指能够建模自然语言文本生成概率的模型 从语言建模到任务求解
2025-03-11
大模型
#大语言模型课程

构建问答系统之更新知识库与微调二者比较

一、参考文章 (1)RAG & 微调,我们应该如何选择? 二、什么时候需要使用RAG,什么时候使用微调 要求/使用对象 RAG 微调 (1)要构建一个需要访问外部数据源的 LLM 应用程序 Y (2)应用程序需要专门的写作与回答风格(如客服)或与特定领域的语言和惯例深度一致 Y (3)抑制幻觉 Y
2025-03-10
大模型
#更新知识库 微调

DeepSeek的用法整理(持续更新)

以下列举出了DeepSeek相关的、暂时需要较专业命令或专业操作的相关描述。常用的如文生普通的文字、图生成,不再列举。 其他的如文生视频、视频生文、视频生视频等自己暂时还未接触到,后续知道再补充。 一、文生思维导图 1.1 访问DeepSeek生成mk格式内容 image-20250308181858148 1.2 创建一个.txt文件 image-20250308
2025-03-08
#DeepSeek使用

什么是模型微调

一、 微调本质 模型微调是从英文翻译过来的词语,原英文是”Fine-tuning“。 模型微调就是:通过特定领域数据对预训练模型进行针对性优化,以提升其在特定任务上的性能。 用通俗比方解释就是就是,如果预训练模型是一个厨艺不错的厨师,它已经有了大量的烹饪经验,掌握了很多知识和技能,但可能并不擅长做某个菜系(如湘菜)的菜,而只是会一些普通的家常菜。此时我们这个厨师提供了专门做湘菜的教程与训练(
2025-03-07
大模型
#模型微调

纯CPU本地微调DeepSeek-R1-1.5b模型(还在完善中)

一、文档说明与服务器准备 1.1 文档说明 这是一篇保姆级别的"微调DeepSeek-R1-Distill-Llama-8B模型"的操作文章,只要稍微懂点计算机软件知识就可以成功复现此文章中所述内容。 此文档中尝试微调DeepSeek-R1蒸馏模型比如1.5B,它仅靠CPU就能运行。 1.2 服务器与GPU准备 此次使用的服务器是一个x86_64构架的Hygon C86 5380物理服
2025-03-06
大模型
#微调

2025年3月2日长沙市望月公园随拍

2025年3月2日,今天白天天气不错。今天发点不一样的,因为这几天学习已经快抑郁了,趁着天气好出去放放风。前两天就听说长沙市几个地方的樱花已经盛开,比如望月公园。下午4点左右赶到望月公园,人流量挺大的。几乎所有人手里都着手机在拍照,拍摄对象主要是拍樱花与美女,拍摄方式有商拍、随拍、自拍。 很多人拿着相机在拍照,特别是随拍的美女,很多人直接就拍上了,看到被拍乐意被拍,我也成为拍摄对方中的一员。其中
2025-03-02
#望月公园随拍

PyTorch框架基础实践

一、PyTorch简介 1.1 PyTorch是什么 Ø 开源的机器学习/深度学习框架( https://pytorch.org/ ) Ø 2017年1月,FAIR(Facebook AI Research)发布了PyTorch 0.1 Ø 它强调易用性和灵活性,并允许用深度学习领域惯用的 Python 来表示深度学习模型 Ø PyTorch 提供了一个核心数据结构—张量(Tensor
2025-03-01
机器学习
#PyTorch框架基础实践

大模型与AIGC概述

一、大模型是什么 将以国产大模型阿里巴巴公司推出的“通义千问”为例子进行演示。它需要提前注册账号(其实用支付宝或淘宝账号也能登录)比如用手机号进行注册登录。 image-20250225120223430 1.1 大模型的定义 起源:大语言模型(Large language Models,LLMs),围绕自然语言处理任务而创建的一系列模型。 发展:基础模型(Foundati
2025-03-01
大模型
#大模型与AIGC概述

torch1.13.0+cpu中tensor的常用属性与方法

一、构建tensor 1234#一、构建tensor###PyTorch常用数据类型#官方教程: https://pytorch.org/tutorials/beginner/basics/tensorqs_tutorial.html#官方API文档: https://pytorch.org/docs/stable/index.html 12345678###张量(Tensor):PyTorc
2025-02-28
机器学习
#tensor的常用属性与方法
1…678910…13

搜索

Hexo Fluid
总访问量 次 总访客数 人