大模型如何"记住"你说过的话:多轮对话机制与 Go 实操

大模型如何"记住"你说过的话:多轮对话机制与 Go 实操 大家好,我是极客老墨。 我刚开始做 AI 应用的时候,有个直觉假设:“模型后台应该有个数据库,记住了我的聊天记录。“后来才发现完全不是这么回事。 主流大模型 API 都是"无状态”(Stateless)的。 每一次你发请求过去,它都完全不记得你之前说过什么。之所以它能接住你的话茬,是因为开发者每次都把之前的聊天记录打包发给了它。 这篇就来聊聊,怎么在 Go 代码里实现这种"人工记忆”。 一、多轮对话的本质:以存储换记忆 在 API 调用层面,模型并不负责存储对话历史。实现多轮对话的公式其实很简单: $$新请求 = 对话历史 + 当前问题$$ 每次你提问,你的程序都要从内存(或数据库)里把之前的对话翻出来,拼成一个数组发过去。模型读完这一长串,才能理解你说的"它"是指谁,或者"接着说"是要说什么。 1sequenceDiagram 2 participant User as 用户 3 participant App as 你的 Go 应用 4 participant LLM as 大模型 (DeepSeek) 5 6 User->>App: 1. "你好,我是老墨" 7 App->>LLM: POST [User: 你好,我是老墨] 8 LLM-->>App: "你好,老墨!" 9 App-->>User: "你好,老墨!" 10 11 Note over App: 内存存储: [User: 你好, Assistant: 你好老墨] 12 13 User->>App: 2. "我刚才说我叫什么?" 14 App->>LLM: POST [User: 你好, Assistant: 你好, User: 我刚才说我叫什么?] 15 LLM-->>App: "你刚才说你叫老墨。" 16 App-->>User: "你刚才说你叫老墨。" 二、Messages 数组的三大角色 在标准的 chat/completions 接口中,messages 数组是唯一的上下文载体。它由三种角色组成: ...

2026-06-27 · 6 min · 1243 words · 老墨

开发者如何接管大模型:API 调用逻辑深度拆解

开发者如何接管大模型:API 调用逻辑深度拆解 大家好,我是极客老墨。 做大模型开发,最爽的一点就在于:你不需要懂怎么训练模型,你只需要懂怎么把它”接管”进你的业务系统。 我刚开始做 AI 应用时,也把 API 调用理解成”发个 POST、收个字符串”,结果一上生产就翻车:成本失控、超时、流式中断、JSON 解析失败、缓存命中率低得可怜。 2026 年这套活,已经从”能调通”升级成”调得稳、调得省、调得可观测”。尤其 DeepSeek V4 的 thinking mode、上下文缓存、流式输出,让 API 层直接从”胶水层”变成了”核心工程层”。 这篇我就按真实项目视角,把 API 调用链路从协议到代码,从错误恢复到成本控制,彻底掰开讲清楚。 一、先立一个工程观:调用模型,本质是远程协作 把模型 API 想成“远程同事”会更容易理解: 你发的请求体,不只是参数,而是任务工单。 返回的 token,不只是文本,而是这个同事边想边说的过程。 usage 字段,不只是统计,而是你的财务报表。 我早期总把调用失败归因于”模型智商不够”,后来复盘发现 70% 的问题是工程姿势不对:上下文组织烂、超时策略缺失、重试机制粗暴、流式解析不规范。 老墨说: 你要把 API 当成数据库连接池一样认真管理。对待数据库你不会裸奔重试,对待大模型也不该。 二、2026 版:开发者与模型的“分工协议” 在 AI 应用开发中,分工正在变得更加精密: 模型厂商 (DeepSeek/OpenAI):负责烧钱买卡,并把能力封装成兼容 OpenAI 协议的 HTTPS 接口。 开发者 (你):不只是写业务逻辑,更像一个”流量调度员 + 成本控制官”——通过 thinking 参数和 reasoning_effort 平衡速度与深度,通过优化 Prompt 结构提高缓存命中率,再通过超时/重试/降级把稳定性托住。 这种分工决定了开发者的核心价值:不是调 Prompt 的手感,而是把成本、质量和稳定性三件事同时管住。 官方参考: DeepSeek Chat 接口:Create Chat Completion DeepSeek Thinking Mode:Thinking Mode DeepSeek 上下文缓存:Context Caching OpenAI 结构化输出:Structured Outputs 三、API 调用的生命周期:2026 增强版 一次现代大模型 API 调用(以 chat/completions 接口为例)遵循以下生命周期: ...

2026-06-24 · 4 min · 686 words · 老墨

开发者必备的"饭碗":大模型应用开发工具链全景图

开发者必备的"饭碗":大模型应用开发工具链全景图 大家好,我是极客老墨。 前几篇讲完了大模型的工作逻辑、Token、上下文和 API 参数。到这里,已经不能只停留在“会调接口”了。真正做项目时,问题会很快变成另一组: 代码应该让 AI 在 IDE 里补,还是交给终端 Agent 改? 一个功能要不要让 Codex 或 Claude Code 自己开分支、跑测试、提 PR? DeepSeek 便宜,但工具链怎么接?有没有 Claude Code 之外的选择? Prompt 改了以后,怎么知道不是“感觉变好了”? Agent 能跑命令、改文件、连 MCP,权限边界怎么收住? 这就是工具链的价值。 2024 年以前,很多人说“AI 编程工具”,其实是在说补全插件。2025 年以后,重点明显变了:Coding Agent 开始进入真实工程流程。它不只是补一行代码,而是能读仓库、改文件、跑命令、看测试、解释 diff,甚至在云端并行处理多个任务。 所以这篇不再按“工具排行榜”写。更实用的方式,是按一条大模型应用开发流水线来拆:模型底座、编码 Agent、Agent 应用框架、本地调试、评测观测、Go 生态,以及上线前的权限和成本控制。 本文按 2026-06-19 可查到的公开资料整理。AI 工具更新很快,具体模型名、价格、可用地区和安装方式,以官方文档为准。 一、模型 API 平台:先把底座选稳 大模型应用的底座还是 API。工具再花哨,最后都要回到三件事:能力、成本、稳定性。 1. DeepSeek:低成本长上下文,适合大量工程试错 DeepSeek 当前官方模型表里,主模型是 deepseek-v4-flash 和 deepseek-v4-pro。官方文档显示二者都支持 1M context、JSON Output、Tool Calls 和 Thinking Mode,OpenAI 格式 base URL 是 https://api.deepseek.com,同时也提供 Anthropic 格式入口。 ...

2026-06-20 · 5 min · 990 words · 老墨

大模型 API 核心参数:调对了事半功倍,调错了钱打水漂

大模型 API 核心参数:调对了事半功倍,调错了钱打水漂 大家好,我是极客老墨。 我刚开始接大模型 API 时,最容易犯的毛病就是把所有问题都往 prompt 上推。输出不稳定,先改 prompt;JSON 解析失败,继续改 prompt;账单涨了,还想着是不是 prompt 不够精简。改到最后,prompt 越写越长,接口却还是像没装仪表盘的车,能跑,但不知道哪里在烧钱、哪里在抖。 这篇不讲玄学调参。我就按一个常见场景来讲:做一个客服工单摘要接口。 输入是一段用户和客服的对话,输出要稳定变成这样的 JSON: 1{ 2 "summary": "用户咨询退款到账时间,客服告知预计 3-5 个工作日", 3 "category": "refund", 4 "risk_level": "low", 5 "next_action": "等待退款到账" 6} 这个接口看着简单,真接到业务里会遇到四个问题: 有时输出一段自然语言,JSON 解析直接炸。 有时写到一半停了,字段缺一截。 有时同一条工单跑两次,分类不一致。 有时为了一个简单摘要开了推理模式,成本和延迟都上去了。 这些问题不全是 prompt 的锅。后来我才把 API 参数当成方向盘、油门、刹车和仪表盘来看:prompt 负责告诉模型要去哪,参数负责控制它怎么走、走多远、花多少钱、异常时怎么停下来。 本文以 DeepSeek API 为主线。DeepSeek 当前官方文档里,Chat Completions 的模型 ID 是 deepseek-v4-flash 和 deepseek-v4-pro;deepseek-chat、deepseek-reasoner 仍可兼容,但官方已说明将于 2026/07/24 弃用。下面的参数口径按本文撰写时查阅的官方文档编写,后续以官方最新文档为准。 model:先选一辆够用的车 客服工单摘要这类任务,第一版通常不需要最强模型。它不是奥数题,也不是复杂代码审查,核心是稳定抽取、分类、压缩信息。 DeepSeek 当前官方模型表里有两个主模型: model 适合什么 deepseek-v4-flash 延迟、成本更敏感的通用任务,比如摘要、分类、提取、普通问答 deepseek-v4-pro 更复杂的推理、规划、工具调用、代码分析 官方还保留了两个兼容别名: deepseek-chat:对应 deepseek-v4-flash 的非 thinking 模式。 deepseek-reasoner:对应 deepseek-v4-flash 的 thinking 模式。 这里有个很实用的判断:能用 deepseek-v4-flash 跑稳,就先不上 deepseek-v4-pro;能关 thinking 跑稳,就先不开 thinking。 ...

2026-06-17 · 10 min · 1987 words · 老墨

Token 是什么:大模型计费和上下文管理的底层逻辑

Token是怎么来的:大模型计费和上下文管理的底层逻辑 大家好,我是极客老墨。 上一篇讲大模型工作原理时,Token 出现了很多次。这一篇专门把它讲透——不是因为概念难,而是因为它的每一个细节都直接影响你的 API 账单和代码行为。 成本超支、上下文莫名截断、多轮对话"失忆"——这些新手最常踩的坑,根子都在 Token 上。 一、Token 是什么:BPE 分词不是按字切 Token(中文翻译定义为“词元”) 是大模型处理文本的最小单位。但很多人对它有一个根本性的误解:Token 不等于字,不等于词,更不等于汉字。 主流大模型(包括 DeepSeek)使用的分词算法叫 BPE(Byte-Pair Encoding,字节对编码)。它的逻辑是:从字节出发,统计语料中最高频的字节对,反复合并,最终形成一个包含几万到十几万个"子词单元"的词表。 结果就是:Token 的边界是由训练语料的统计规律决定的,不是人为规定的。 1# 英文示例(DeepSeek tokenizer) 2"developer" → ["developer"] # 1 token(高频词,整词入表) 3"tokenization" → ["token", "ization"] # 2 tokens(低频长词,拆分) 4"DeepSeek" → ["Deep", "Seek"] # 2 tokens(专有名词) 5 6# 中文示例 7"大模型" → ["大", "模型"] # 2 tokens("模型"是高频词组) 8"量子纠缠" → ["量", "子", "纠", "缠"] # 4 tokens(低频,逐字) 9"API" → ["API"] # 1 token 中英文的核心差异: ...

2026-06-13 · 6 min · 1111 words · 老墨

大模型是怎么炼成的:从训练数据到你手里的 API

大模型是怎么炼成的:从训练数据到你手里的 API 大家好,我是极客老墨。 你有没有想过:ChatGPT、DeepSeek,这些大模型是怎么"造"出来的? 很多人用了大半年 AI,依然不知道答案。他们知道模型很强,但不知道强从哪来;知道调 temperature 能改变风格,但不知道为什么。这种"只会开车、不知道发动机"的状态,限制了你对 AI 能力边界的判断,也限制了你设计 AI 应用的想象力。 这篇文章要做一件事:把大模型从"一堆原始数据"到"你手里的 API"这条完整链路讲清楚。 普通人能看懂,开发者能用上。 第一段:模型是怎么被造出来的 大模型的诞生,分四个阶段,缺一不可。 1flowchart TD 2 A["海量原始数据 3 网页/书籍/代码/论文"] --> B["预训练 4 Next Token Prediction"] 5 B --> C["指令微调 SFT 6 教模型听懂人话"] 7 C --> D["强化学习对齐 RLHF 8 教模型说对的话"] 9 D --> E["量化 & 部署 10 压缩上线"] 11 E --> F["你调用的 API"] 阶段一:预训练——从"0"开始读书 预训练是整个大模型能力的根基。这个阶段,模型什么都不知道,就像一张白纸。 研究团队先从互联网抓取海量文本的网页数据、Wikipedia、GitHub 代码库、arXiv 论文、书籍……DeepSeek-V3 的预训练数据量超过 14.8 万亿个 Token。这是什么概念?一个人一天读 8 小时,读完大概需要 2 万年。 ...

2026-06-10 · 3 min · 595 words · 老墨

大模型能干什么:六大核心应用场景拆解

大模型能干什么:六大核心应用场景拆解 大家好,我是极客老墨。 有个问题我被问过很多次:大模型除了聊天,还能干什么? 这个问题背后藏着一个更深的困惑:我学大模型开发,到底能做出什么东西?值不值得投入时间? 值得。但前提是你得搞清楚它的边界——哪些场景是大模型真正擅长的,哪些是现在能落地的,哪些是看着很美但开发成本极高的。 这篇文章拆解六个核心场景:文生文、文生图、文生视频、语音交互、数字人、智能问答。每个场景我会讲清楚技术本质是什么、真实能力边界在哪里、开发者能拿它做什么,以及一个 Go 开发者该从哪里切入。 不堆概念,只讲和开发直接相关的部分。 一、文生文:最成熟,也最容易被低估 技术本质 文生文(Text-to-Text)是所有大模型能力的基础层。给定一段文本输入,模型输出文本结果——翻译、摘要、续写、代码生成、问答、分类、抽取,本质都是这个范式。 它的核心机制是自回归生成(Autoregressive Generation):模型逐个 token 预测,每次预测都以前面所有内容为条件。这意味着它天然支持任意长度的输出,也意味着它的"思考"过程是线性的、不可并行的。 能力边界 文生文做得好的事:结构化生成、风格迁移、代码辅助、信息抽取、分类标注。 文生文目前还做不好的事:精确计算(数学运算容易出错)、实时数据(知识截止限制)、高度确定性任务(每次输出有随机性)。 2026 年之后,推理模型(DeepSeek-R1、OpenAI o3)的出现让数学和逻辑推理能力大幅提升——但这是专门设计了长思维链的推理模型,普通对话模型仍然存在上述限制。 开发者能做什么 1用户需求 → Prompt → 大模型 → 文本输出 → 业务逻辑处理 这是最简单的链路,也是 90% 的大模型应用的骨架。几个典型落地方向: 代码辅助:接入 IDE 插件,或者独立的代码问答服务。输入自然语言描述,输出对应语言的实现代码。DeepSeek-V3 在代码生成上性价比极高,是首选。 文档处理:上传合同、技术文档、会议记录,提取关键信息、生成摘要、回答问题。结合 RAG(后面的模块会详细讲),可以大幅减少幻觉。 内容生成:营销文案、邮件草稿、产品描述、SEO 内容。注意:大模型不是完美的,高质量内容生成必须加人工审核环节。 结构化抽取:从非结构化文本中提取 JSON 格式的数据,配合 Function Calling 或 Structured Output,可以直接对接业务数据库。 老墨说: 文生文不只是"聊天",它是一个可编程的文本处理引擎。你用自然语言定义规则,它按规则处理任意输入——这是一种新的编程范式,比你写正则表达式和 if-else 强大得多,也灵活得多。 二、文生图:创意的民主化 技术本质 文生图(Text-to-Image)的主流技术路线是扩散模型(Diffusion Model)——从随机噪声出发,在文本描述的引导下,迭代去噪,最终生成图像。代表模型有 Stable Diffusion、DALL·E 3、Midjourney、Flux。 这和文生文用的技术栈完全不同。大多数大模型 API 平台(OpenAI、智谱、火山引擎)会把文生图单独封装成一个 API 端点,你不需要了解扩散过程,直接调用即可。 ...

2026-06-06 · 3 min · 511 words · 老墨

大模型发展史:从一篇论文到改变世界

大模型发展史:从一篇论文到改变世界 大家好,我是极客老墨。 有人问过我:学大模型开发,需要搞清楚历史吗? 我的答案是:不需要全记,但有几个节点绕不过去。就像你不需要知道 Linux 每一个版本的变化,但如果你不知道 1991 年 Linus 为什么会写内核、不知道 GPL 协议的来历,你就很难理解为什么今天的开源生态长成了现在这个样子。 大模型的历史也是一样的道理。 这篇文章不是"时间轴背诵手册",而是帮你搞清楚:每一个关键节点留下了什么技术遗产,以及这些遗产如何层层叠加,构成了你今天调用 API 时那个"黑盒"里的底层逻辑。 第一阶段:奠基期(2017–2019)——骨架确立,两条路线分叉 在 2017 年之前,AI 语言模型靠 RNN 和 LSTM 驱动。这两种架构有一个致命弱点:序列化处理——它们必须一个词一个词地读,前面没读完,后面没法算。这就导致了两个问题:长文本里的前后关联容易丢失,训练也难以并行,规模扩不上去。 这个局面被一篇论文打破了。 Transformer 诞生(2017 年 6 月) Google Brain 团队的 Ashish Vaswani 等人发表了 Attention Is All You Need,提出了 Transformer 架构,核心是"自注意力机制(Self-Attention)"。 它的革命性在哪里?一句话:让模型在处理一个词的时候,能同时看到整个句子里所有词的关联权重,而不是只看"左边刚读过的"。 并且这个计算是可以并行的——GPU 的算力第一次被大模型充分用上了。 Transformer 由 Encoder(理解)和 Decoder(生成)两部分组成,可以灵活组合。这个设计直接决定了后来大模型的两条技术路线。 老墨说: Transformer 是大模型的底层骨架,今天你用的 GPT、Claude、DeepSeek,技术根基都在这篇 2017 年的论文里。你可以不懂数学,但"自注意力"这个词要知道它是干什么的。 两条路线分叉(2018 年) Transformer 出来之后,OpenAI 和 Google 各自选了一条路。 GPT-1(2018 年 6 月,OpenAI):只用 Decoder,专注文本生成。1.17 亿参数,在约 5GB 的书籍语料上预训练,验证了"预训练+微调"在生成任务上的可行性。能力有限,但确立了 GPT 系列"纯 Decoder 生成式"的路线。 ...

2026-06-03 · 4 min · 688 words · 老墨

什么是大模型:开发者必须搞清楚的核心概念

什么是大模型:开发者必须搞清楚的核心概念 大家好,我是极客老墨。 2022 年 11 月 30 日,OpenAI 悄悄上线了一个叫 ChatGPT 的产品。没有发布会,没有大规模营销,结果五天内注册用户突破 100 万,两个月后破 1 亿——成为史上用户增长最快的消费级应用。 这一年,我第一次在终端里用 API 让它写了段 Go 代码,代码是对的。我盯着屏幕看了很久,心里有个声音说:这东西不一样。 这篇文章的目标很简单:搞清楚大模型是什么,从哪来,现在有哪些主流选择,以及作为开发者你需要知道哪些核心概念。不涉及数学,不涉及训练原理,只讲和开发直接相关的部分。 大模型是什么 大模型(Large Language Model,LLM),本质是基于海量文本数据训练出来的神经网络模型,通过学习语言的统计规律,获得了理解和生成自然语言的能力。核心参数规模通常在百亿级以上——这也是"大"的由来。 一个直白的类比:你可以把大模型想象成一个读过人类几乎所有书籍、论文、代码、对话记录的人。它没有真正的"理解",但它见过的模式足够多,所以当你给它一段输入,它能预测出"接下来最合理的内容是什么"——而这个"预测"往往精准得令人惊讶。 对开发者来说,有三件事最重要: 调用方式:你不需要自己训练模型。通过 API,几行代码就能接入 GPT、DeepSeek、Claude 等顶级模型的能力 核心价值:大模型把自然语言变成了一种编程接口——你用人话描述需求,它输出结果,极大降低了 AI 功能的开发门槛 能力边界:参数规模决定了模型的能力上限,但训练数据质量、微调策略同样关键。参数多不等于万能 老墨说: 别被"大"字唬住。大模型对开发者的意义就一句话:用 API 调用别人训好的模型,你只管写业务逻辑。 大模型从哪来:关键发展节点 大模型的演进不需要全记,但有几个节点值得了解——它们直接决定了今天你能用到的技术基础。 2017 年:Transformer 诞生 Google 发表了论文 Attention Is All You Need,提出了 Transformer 架构。这篇论文是今天几乎所有大模型的技术根基。在它之前,语言模型用 RNN(循环神经网络),慢且难以并行训练;Transformer 引入了自注意力机制,让模型能同时关注序列中所有位置的关联,训练效率和能力都大幅提升。 2020 年:GPT-3 开启规模时代 OpenAI 发布 GPT-3(1750 亿参数),首次证明了"规模即能力"——只要参数足够大、数据足够多,模型会涌现出意想不到的新能力。这一发现改变了整个 AI 研究方向。 2022 年:ChatGPT 引爆应用层 ...

2026-05-30 · 3 min · 513 words · 老墨

用 AI Skills 武装你的写作流程,从此告别重复劳动

用 AI Skills 武装你的写作流程,从此告别重复劳动 每次让 AI 帮我写技术文章,我都得重新交代一遍:“你是一个有 20 年经验的工程师,语言要接地气,开头要有钩子,结尾要总结,不要废话……” 打完这段话,文章还没开始写,我已经累了。 这就是我开始研究 Agent Skills 的起点。研究完之后,我只想说:早该有这东西了。 一、什么是 Agent Skills? 2025 年 12 月 18 日,Anthropic 把 Agent Skills 作为一个开放标准发布出来,规范地址在 agentskills.io。OpenAI Codex、GitHub Copilot、VS Code 等主流平台随后跟进支持。 官方文档对 Skills 的定义是: Skills are reusable, filesystem-based resources that provide Claude with domain-specific expertise: workflows, context, and best practices that transform general-purpose agents into specialists. 翻译成人话:Skill 是一个文件夹。里面放着你对 AI 的"专项培训材料"。当 AI 遇到匹配的任务时,它会自动加载这个文件夹里的内容,按照你的规范工作——不用你每次都重新解释。 用一个生活比喻:你雇了一位新助理,第一次你花了两个小时教她公司的排版规范、写作风格、邮件模板。从第二次起,你只需要说"按老规矩来",她就能做对。Skill 就是那份"老规矩"的电子版。 老墨说: Skill 解决的核心问题是重复交代——把每次对话都要说的上下文、规范、工作流程,封装成一个可复用的模块。 ...

2026-04-02 · 4 min · 681 words · 老墨

Accio Work真的30分钟给我搞了shopify店铺

大家好,我是极客老墨。 最近一直在研究各种 Claw,自 OpenClaw 大火之后,确实有非常多的 Claw 相继诞生。你别说,真的一个比一个好用,QClaw 能够配合 ima伴你搞定全自动知识库;悟空帮你搞笑完成日程、文档、会议,还能帮你搜索、分析电商热销商品、比价……它们虽然专注的点不同,但都结合自己的产品主打一个全自动化。 今天,我想分享的这个是一款做跨境电商的利器 —— Accio Work,这玩意儿不光全程指导完成Shopify独立站的搭建,还帮我组建一个运营团队,实现真正的团队协作! 我们来看一下什么是 Accio Work。 简单来说,Accio Work 只主打跨境电商的AI工具,内置了非常多的技能和Agent,只要你给它授权,它就能自己写代码、自己装修网站、自己选品和自己上架、售卖商品。 今天,老墨就用我刚开的一个做东南亚市场的“丑萌毛绒玩具”店(怪异实验室 UglyCute Lab)为例,展示一下怎么用 Accio Work 在 30 分钟内把一个空壳店铺跑上线。 第一步:准备一个 Shopify 空壳 Shopify 是加拿大的一个全球跨境电商的平台,任何人都可以在上边开自己的独立店铺,只需要每月交付一定的费用。 不管 AI 多牛,店铺的基础还得你自己建。 打开 Shopify 官网,用邮箱注册一个免费试用账号。 随便起个店铺名字,把基础后台开通。 新注册的账号有3天的免费试用时间,满了之后需要支付1美金的费用,也是给新手一个过渡期。 老墨建议:这个时候不要急着绑信用卡交月租。先把基础跑通,看到店铺成型了再交钱不迟。 第二步:让 Accio Work 帮你分析市场并选品 下载 Accio Work,登录并打开,你可以看到智能体这一个菜单中,有多个Agent,需要用到的就是这个内置的 Shopify Operator,他可以帮我们一步一步把Shopfiy店铺搭建完成。 点击对话,就可以直接开启Shopify店铺构建之旅了,直接告诉他:“我想要在shopify上开设一个面向东南亚地区的丑萌玩具店铺,帮我策划“, 然后,它就开始进入开店流程,它把整个流程分为了5个节点,引导你一步步完成: 然后,它自动开始做第一阶段的选品调研,它分析了亚马逊、1688等市场上的产品,给出了具体的产品和收益分析: 这个市场分析个人感觉可以参考,但必须集合自己的判断才行,最好是自己去到亚马逊、阿里巴巴调研一下。 第三步:获取 AccessToken 接下来,需要获取 Shopify 的 AccessToken,以便AI能够通过 api 来帮我管理店铺。本来,我一开始创建店铺的时候,AI助手直接给我安装了一个 QuickToken 的插件自动申请 AccessToken,但是不知道为什么现在下架了,只能手动创建了。 ...

2026-03-29 · 1 min · 171 words · 老墨

2026 年了,这些 AI IDE 还能白嫖

大家好,我是极客老墨。 去年这个时候,我还在纠结要不要订阅 Cursor Pro。今年,我的电脑里装了七八个 AI IDE,一个月下来,花的钱是零。 不是我抠门,是这些工具的免费额度真的够用。写个脚本、改改 Bug、重构代码,基本不用掏钱。当然,如果你是重度用户,每天写几千行代码,那该付费还是得付费。但对于大部分开发者来说,薅羊毛的空间还是很大的。 下面这些工具是我这段时间用下来觉得值得折腾的,有些需要科学上网,有些需要改地区,有些直接某宝买个 Key 就能用。别问我怎么搞,懂的都懂。 为什么需要 AI IDE? 说实话,刚开始我也觉得 AI 写代码是噱头。直到有一次我要写个 Python 脚本处理 JSON 数据,平时可能要查半天文档,结果 Cursor 直接给我生成了,改都不用改。 回想一下,2025 年初的时候,GitHub Copilot 还只能做行内补全,写个函数名它给你补全函数体,仅此而已。那会儿大家还在惊叹"哇,AI 能写代码了"。结果到了 2025 年中,Cursor 出来了,直接能多文件编辑,Cmd+K 一下改十几个文件。再到 2025 年底,Claude 3.5 Sonnet 发布,上下文窗口直接干到 200K,能理解整个项目的代码逻辑。 现在 2026 年初,这才过了一年,AI IDE 已经卷到什么程度了?Windsurf 免费无限补全,Kiro 支持本地模型和自定义工作流,Antigravity 能看懂设计稿直接生成 UI 代码。一年前你还在为 Copilot 的 10 刀月费纠结,现在免费工具多到用不过来。 更夸张的是模型本身的进化速度。GPT-4 刚出来的时候,写个复杂算法还经常出 Bug。现在 Claude 3.5 Sonnet 和 GPT-4 Turbo,不仅能写代码,还能做代码审查、重构、写测试、解释架构。去年你还在担心 AI 会不会抢饭碗,今年你已经在担心不用 AI 会不会被淘汰。 这个速度真的有点吓人,而且仍然再以肉眼可见的速度飞速发展。谁能想到,在2026年初,你只要描述你的需求,AI就能直接给你生成完整的、能够直接运行的前后端代码,包括 UI 设计都能给你实现!虽然编写大型代码还存在一定的问题,但是老墨大胆预测一下,2026年将迎来 AI 齐头并进、百花争艳的盛况! ...

2026-02-23 · 5 min · 969 words · 老墨