深度求索DeepSeek：这个“卷王”把AI价格打了下来

说实话，我对DeepSeek最早的印象停留在“开源圈的火爆”。但2025年底到现在，这家公司几乎每个月都在搞事情。V4预览版上线、专家模式推出、R2开源模型炸场——最离谱的是它的API定价，直接把全球大模型的价格体系掀了个底朝天。

原创

AI老司机

找找AI

终于轮到DeepSeek了。前几期聊了腾讯元宝、豆包和混元，这次写一个让我彻底刷新认知的——DeepSeek。

我用DeepSeek-V4有一段时间了，最大的感受是：这是一个“技术宅”气质的AI，不整花里胡哨的UI动画，不跟你客套寒暄，上来就是“我把活干完，你自己看”。

如果说元宝是离你最近的AI，那DeepSeek就是性价比最狠的AI。

百万上下文：一次性吃完《三体》三部曲

这是DeepSeek-V4最让我震撼的功能。

V4全系列标配了100万Token的超长上下文。换算成中文大约是75万字，媒体圈喜欢用一个形象的类比：这相当于AI能一次性读完《三体》三部曲的全部内容，而且记得清清楚楚。

我拿了一本30万字的行业白皮书丢进去测试，让它总结核心观点。它不光给了摘要，还自动提取了跨章节的关键逻辑链条，准确率比我人工翻读两小时高得多。官方数据显示，在长文档摘要测试中，V4对跨章节核心观点的提取准确率达到92%，较传统方案提升41%。

以前用其他AI处理长文档，你得切片、分段、反复喂，像个碎纸机操作员。现在直接把整本书丢给它，它一口吞完还能给你吐出思维导图。

官方甚至放话：“从现在开始，1M上下文将是DeepSeek所有官方服务的标配。”——“长文本”从高端功能变成了像水电煤一样的基础设施。-44

找找AI独家小技巧：想让V4在1M超长上下文中保持前后一致性，可以在喂文档之前加一句“请逐段精读，重点关注决策性信息和对比性结论，并在最后输出时标注原文引用位置”。实测这样能大大降低8万Token以上长对话中的上下文遗忘概率。另外，如果需要处理超过800K Token的连续对话，建议分段提问——先让模型总结前半部分，再基于前半部分的摘要处理后半部分，这样可以避免注意力过度稀释。

Agent能力：AI终于学会“自己干活”了

如果说长文本是记忆力的飞跃，那Agent能力的进化才是V4最核心的灵魂升级。

在以往的版本中，你指挥AI干活，它像是个只会回答问题的实习生，你得一步步教。而在V4上，它更像一个能“自主干活”的老员工。

DeepSeek甚至把V4用作内部员工的主力编程助手，据其官方自评：使用体验优于业界著名的Anthropic Sonnet 4.5，交付质量接近Opus 4.6。

我自己试了一个场景：让它调用工具去查询数据并生成可视化报表。以前得一步步告诉它“先查A再查B，然后转成表格最后画图”，现在只需要说一句“帮我分析一下某领域过去一年的趋势，做出一份带图表的报告”，它能自己规划步骤、调用工具、处理报错，最后交出一份完整的东西。

找找AI独家小技巧：想让V4的Agent功能发挥到极致，可以像带新员工一样给它一个“任务拆解指令”——“请把这个任务拆成三个步骤：第一步做什么，第二步做什么，第三步做什么，每完成一步后问我是否继续”。这样AI不会一口气做到底然后跑偏，而是边做边确认，容错率大大提升。高阶用法：在步骤指令后面加上“如果遇到错误，请尝试三种不同的解决方案，记录每次尝试的结果后再请求人工介入”，V4的试错能力和鲁棒性会让你惊讶。

双模式切换：原来AI也可以“分人设”

2026年4月，DeepSeek网页版悄然上线了一项更新——“快速模式”与“专家模式”双模式切换。

快速模式主打即时响应，适合日常对话，支持图片及文件文字识别；专家模式则擅长处理复杂问题，比如编程、法律、医学咨询，及数理逻辑推理。

两种模式的核心差异是：快速模式把活儿干完，专家模式把事儿想透。实测下来，快速模式的响应时间压到了2秒以内，适合查天气、做翻译、整理会议纪要这类高频低负载任务；专家模式则会在推理链路上花更多时间，但回答的深度和逻辑严谨度明显提升。-

有一个容易被忽略的区别：专家模式的知识库截止日期为2025年5月，而快速模式的知识库更新至2026年4月——所以追热点新闻用快速模式，查历史资料用专家模式。-

找找AI独家小技巧：在同一个对话里是可以来回切换模式的，而且切换后上下文不会中断。有一个性价比极高的玩法——先用快速模式快速获取基本信息，发现回答不够精准或逻辑有漏洞时，当场切到专家模式，输入“请对我刚才的问题进行深度推演，检查是否有逻辑矛盾或遗漏”。这样相当于先用快车赶路，再换慢车精读，效率和深度兼得。另外，专家模式初期不支持文件上传，但4月9日已经更新支持了，单次最多传50个文件、每个100MB。-

R2开源：550万美金干翻百亿投入

如果说V4是DeepSeek的旗舰产品，那R2就是它的技术宣言。

2026年5月16日，DeepSeek发布R2开源模型——670B参数的MoE架构，多项基准超越Meta的LLaMA 4。最夸张的是训练成本：仅550万美元。

要知道Meta砸了数十亿美元做LLaMA系列，DeepSeek用不到六百万美金就做到了全面超越。这已经不是弯道超车，这是换道超车。R2发布后，HuggingFace 24小时下载量突破50万，又一次验证了“技术宅改变世界”的剧本。

找找AI独家小技巧：R2专门针对手写体识别做了优化。以前处理扫描件里潦草的发票数字，AI经常把“3”认成“8”。实测R2在处理手写体表格时，准确率高得离谱——截图上写着“办公用品叁佰贰拾”，它自动转成数字“320”，而不是傻乎乎地复制“叁佰贰拾”。连歪歪扭扭的数字都能看懂，打工人做报表的效率直接起飞。

识图模式：DeepSeek终于学会“看”了

DeepSeek一度是“纯文本战神”——能读，但不会看。

这个短板在2026年5月被补齐了。DeepSeek大范围开放“识图模式”，正式跨入图文交互时代。-

在实测体验中，用户可以直接上传图片让DeepSeek“看”世界，能力边界远超简单的文字提取。它不仅能识别出图片里的文字内容，还能描述画面元素、分析视觉构成。-

不过需要区分：识图模式依托的是快速模式下的视觉理解能力；专家模式下虽然也支持文件上传，但目前只能通过OCR识别文字，不具备原生视觉感知能力。-

找找AI独家小技巧：上传图片给DeepSeek做OCR时，建议选择分辨率不低于800×600、画面端正、文字清晰、无强反光的图片，识别准确率最高。如果是扫描版的PDF，它支持自动转为单页图像序列，不需要你手动导出每一页再上传。-

价格：AI圈的“价格屠夫”

说了这么多功能，最后聊聊大家最关心的——价格。

DeepSeek在定价这件事上，走的是“把门槛打到地板”的路线。V4 Flash版本的输出价格低至2元/百万Token，这个价格不到GPT-5.5输出定价的百分之一。

更有意思的是最近的一连串动作。4月26日，DeepSeek发布API价格调整公告，全系API输入价格降至首发价的十分之一，V4-Pro叠加限时2.5折优惠。原定6月恢复原价，结果5月22日又宣布：直接永久降价到原价的四分之一。

调整后：每百万Token输入（缓存命中）0.025元，输入（缓存未命中）3元，输出6元，创全球大模型价格新低。你没看错，输出单位是“元”而不是“美元”。

找找AI独家小技巧：使用API开发时，注意利用“缓存命中”的计费优势。如果你的应用场景是大量重复或相似查询，建议设计合适的缓存策略——命中状态下每百万Token只要两分五厘钱，相当于无限接近零成本。另外，V4系列全面兼容OpenAI和Anthropic两套接口协议，开发者只需将请求中的model_name参数替换为deepseek-v4-pro或deepseek-v4-flash，即可实现无缝接入，迁移成本几乎为零。

DeepSeek还不够完美的地方

说实话，DeepSeek不是没有短板。

最大的问题是稳定性。就在2026年5月28日上午，大量用户反馈DeepSeek服务出现异常，网页对话和API都中断了。对重度依赖API的开发者来说，这种突发事件会影响用户体验。

多模态深度不足也是一个待解决的问题。V4预览版暂不支持图像识别，用户期待的“看图说话”“图像问答”等功能还需要等后续版本。虽然5月已经开放了识图模式，但这还只是起步阶段。

另外，有评测指出：用户期待的是一个能陪人深聊、能抓住本质的思考者，而目前DeepSeek交付的是一个能力增强但深度可能还不够的模型。在复杂社会议题面前，它的推理链条有时还不够坚韧，细节容易丢失。

还有一点是真实幻觉问题。2025年时曾有评测指出R2在使用过程中幻觉体验问题十分严重。虽然V4系列引入了多维度验证机制，在开放域问答场景中幻觉发生率从18%降至9.3%，但在专业领域（如医疗、法律）的垂直任务中，仍需配合领域知识库进行后处理。

谁适合用DeepSeek？

如果你是开发者——DeepSeek可能是目前性价比最高的选择。百万Token两分五的输出价格，兼容主流通用API协议，再加上开源的R2模型，无论是做小规模测试还是大规模部署，成本压力都可以忽略不计。

如果你是高频用户——每天要处理大量文档、写代码、做报表，DeepSeek的1M上下文和Agent能力能显著提升效率。快速模式和专家模式的灵活切换，让你在不同场景下都能找到合适的AI助手。

如果你是追求极致性价比的普通用户——DeepSeek网页版和App目前完全免费，不限次数，没有什么明显的使用门槛。日常咨询、翻译、写作、信息整理，快速模式都能秒回搞定。

但如果你需要的是高稳定性服务、深度多模态能力（比如频繁需要“看图说话”或视频生成），或者需要在复杂社会议题上做深度讨论——DeepSeek目前可能还不是最成熟的选择。在这些场景下，元宝或豆包的多模态生态会更从容一些。

总的来说，DeepSeek让AI圈学会了一个新词——“极致性价比”。它不是最能聊的，也不是最能看的，但它是目前最能干活的，而且价格几乎可以忽略不计。

至少对我而言，需要处理大量代码、分析超长文档、或者在开发者场景中批量调用API的时候，DeepSeek已经是首选工具了。