-
大模型安全与隐私:从密钥到数据脱敏的落地清单
做大模型应用时,最容易被忽略的往往不是效果,而是安全与隐私:日志里写了用户敏感信息、API Key 泄漏、把不可信内容当成指令执行、把模型输出当成“事实”…… 这篇给你一份偏工程落地的清单,适合... -
提示工程:一套可复用的提示模板(附常见坑)
提示工程听起来像“技巧”,但我更愿意把它当成:把任务规格写清楚。你写得越清楚,模型越稳定;你写得越模糊,模型越像在“自由发挥”。 这篇给你一套可复用模板,配上常见坑位,适合做写作、总结、代码、规... -
RAG 实战:切分、Embedding、检索、重排一条线
大模型最让人头疼的一点是:它会很自然地编故事。而 RAG(Retrieval-Augmented Generation)要做的事很直接:在回答前先检索资料,把“依据”塞进上下文,让回答变得可追溯... -
本地跑大模型:Ollama / LM Studio 选型与调参思路
把大模型放到本地跑,最常见的理由只有两个: 隐私:数据不出本机(尤其是公司资料/个人笔记) 成本:不想按 token 付费,或者经常离线 但本地跑也有代价:硬件、速度、模型大小、显... -
大模型基础:Token、上下文、温度与采样到底在干嘛
很多人第一次用大模型,会被几个词劝退:Token、上下文窗口、Temperature、Top-p……看起来很“玄学”。其实把它们放进一个统一视角里,你会发现它们只是回答两个问题: 模型能看到多... -
API 设计要点:错误码、幂等、分页与限流
API 设计这件事,最怕的是:功能能用,但细节“阴间”。例如: 出错只给一句 “error”,前端根本无法处理 客户端重试一次,订单下了两次 分页翻到一半数据乱跳,用户以为丢了 这篇不讲抽象...