常用互联网资源记录 一、书籍 1.1 免费电子书下载网站 https://www.gutenberg.org/ 二、牛人博客 Jay Alammar:https://jalammar.github.io/illustrated-gpt2/ 斯坦福大学博士Haoyi Duan:https://haoyi-duan.github.io/publications.html 三、机器学习与深 2026-03-09 资源记录 #资源记录
理解精确率与召回率 一、概念介绍与直观对比 精确率(Precision)和召回率(Recall)是机器学习和信息检索领域中的核心概念,目前在评测RAG应用时经常用到。 Precision(精确率)衡量的是生成文本中有多少内容是“正确且必要”的(即被参考文本支持的)。用通俗的话来说,它是:生成文本中包含的“有效信息”占“生成总信息量”的比例。 Recall(召回率) 衡量的是参考文本(标准答案)中包含的所有关键 2026-03-08 AIGC #AIGC
常用AI IDE记录 一、常用AI 插件或IDE汇总 Trae:字节跳动推出,https://www.trae.ai/(国际版)、https://www.trae.cn/(国内版) Cursor:Anysphere公司推出 Claude Code:Anthropics推出 Kiro:亚马逊推出 AntiGravity:谷歌推出,使用谷歌账号登录(要求谷歌账号关联的地区在此IDE可用区域内如新加坡,http 2026-01-04 工具与奇技淫巧 #工具与奇技淫巧
一些常用的命令与配置 一、大模型相关 hf-mirror 参考文档:https://hf-mirror.com/ 12345678910111213141516#1. 安装依赖pip install -U "huggingface_hub[hf_transfer]" modelscope#2. 设置环境变量# Linux 建议将这一行写入 ~/.bashrcexport HF_ENDPOINT 2025-10-20 命令与配置 #命令与配置
大量(TB以上)医疗数据自动标注 一、背景 二、相关开源项目 cvat项目官方文档:https://docs.cvat.ai/docs/administration/basics/installation/ 2025-09-25 数据集处理 #数据标签
Transformer模型构架学习 一、Transformer整体构架 二、Transformer中的QKV 参考文章:https://blog.cnbang.net/tech/3934/ 、 https://zhuanlan.zhihu.com/p/688660519 LoRA微调 https://zhuanlan.zhihu.com/p/646791309 奇异值分解:https://blog.csdn.net/lo 2025-09-23 类别 #标签
Trae仿/续写word文档 一、下载与安装Trae Tare分为国际版与国内版,两边账号好像不通用。 国际版:https://www.trae.ai/ 国内版:https://www.trae.cn/ 二、使用 Trae中无法直接输出docx格式文件,为了更好的理解与输出内容,此文章记录将docx文件转换成html格式,将兼容word的html文件转换成docx格式。 查看docx文件 这是XX项目启动会议纪要 2025-09-16 工具与奇技淫巧 #工具与奇技淫巧
爬虫入门级操作 一、从指定网页爬取指定内容 被爬取网页 https://ask.39.net/news/2685-1.html image-20250913095304442 明确目的 我想爬取这个网页中的问题及其回答。 组织爬取代码 image-20250913105018475 image-20250913105026789 image-20250 2025-09-13 爬虫 #爬虫
tts相关模型与开源library测评 一、TTS 模型(音色与并发性能) huggingface地址:https://huggingface.co/hexgrad/Kokoro-82M-v1.1-zh ,这是一个语音合成模型。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555 2025-09-08 类别 #标签