终于轮到DeepSeek了。前几期聊了腾讯元宝、豆包和混元,这次写一个让我彻底刷新认知的——DeepSeek。
说实话,我对DeepSeek最早的印象停留在“开源圈的火爆”。但2025年底到现在,这家公司几乎每个月都在搞事情。V4预览版上线、专家模式推出、R2开源模型炸场——最离谱的是它的API定价,直接把全球大模型的价格体系掀了个底朝天。
我用DeepSeek-V4有一段时间了,最大的感受是:这是一个“技术宅”气质的AI,不整花里胡哨的UI动画,不跟你客套寒暄,上来就是“我把活干完,你自己看”。
如果说元宝是离你最近的AI,那DeepSeek就是性价比最狠的AI。
百万上下文:一次性吃完《三体》三部曲
这是DeepSeek-V4最让我震撼的功能。
V4全系列标配了100万Token的超长上下文。换算成中文大约是75万字,媒体圈喜欢用一个形象的类比:这相当于AI能一次性读完《三体》三部曲的全部内容,而且记得清清楚楚。
我拿了一本30万字的行业白皮书丢进去测试,让它总结核心观点。它不光给了摘要,还自动提取了跨章节的关键逻辑链条,准确率比我人工翻读两小时高得多。官方数据显示,在长文档摘要测试中,V4对跨章节核心观点的提取准确率达到92%,较传统方案提升41%。
以前用其他AI处理长文档,你得切片、分段、反复喂,像个碎纸机操作员。现在直接把整本书丢给它,它一口吞完还能给你吐出思维导图。
官方甚至放话:“从现在开始,1M上下文将是DeepSeek所有官方服务的标配。”——“长文本”从高端功能变成了像水电煤一样的基础设施。-44
找找AI独家小技巧:想让V4在1M超长上下文中保持前后一致性,可以在喂文档之前加一句“请逐段精读,重点关注决策性信息和对比性结论,并在最后输出时标注原文引用位置”。实测这样能大大降低8万Token以上长对话中的上下文遗忘概率。另外,如果需要处理超过800K Token的连续对话,建议分段提问——先让模型总结前半部分,再基于前半部分的摘要处理后半部分,这样可以避免注意力过度稀释。
Agent能力:AI终于学会“自己干活”了
如果说长文本是记忆力的飞跃,那Agent能力的进化才是V4最核心的灵魂升级。
在以往的版本中,你指挥AI干活,它像是个只会回答问题的实习生,你得一步步教。而在V4上,它更像一个能“自主干活”的老员工。
DeepSeek甚至把V4用作内部员工的主力编程助手,据其官方自评:使用体验优于业界著名的Anthropic Sonnet 4.5,交付质量接近Opus 4.6。
我自己试了一个场景:让它调用工具去查询数据并生成可视化报表。以前得一步步告诉它“先查A再查B,然后转成表格最后画图”,现在只需要说一句“帮我分析一下某领域过去一年的趋势,做出一份带图表的报告”,它能自己规划步骤、调用工具、处理报错,最后交出一份完整的东西。
找找AI独家小技巧:想让V4的Agent功能发挥到极致,可以像带新员工一样给它一个“任务拆解指令”——“请把这个任务拆成三个步骤:第一步做什么,第二步做什么,第三步做什么,每完成一步后问我是否继续”。这样AI不会一口气做到底然后跑偏,而是边做边确认,容错率大大提升。高阶用法:在步骤指令后面加上“如果遇到错误,请尝试三种不同的解决方案,记录每次尝试的结果后再请求人工介入”,V4的试错能力和鲁棒性会让你惊讶。
双模式切换:原来AI也可以“分人设”
2026年4月,DeepSeek网页版悄然上线了一项更新——“快速模式”与“专家模式”双模式切换。
快速模式主打即时响应,适合日常对话,支持图片及文件文字识别;专家模式则擅长处理复杂问题,比如编程、法律、医学咨询,及数理逻辑推理。
两种模式的核心差异是:快速模式把活儿干完,专家模式把事儿想透。实测下来,快速模式的响应时间压到了2秒以内,适合查天气、做翻译、整理会议纪要这类高频低负载任务;专家模式则会在推理链路上花更多时间,但回答的深度和逻辑严谨度明显提升。-
有一个容易被忽略的区别:专家模式的知识库截止日期为2025年5月,而快速模式的知识库更新至2026年4月——所以追热点新闻用快速模式,查历史资料用专家模式。-
找找AI独家小技巧:在同一个对话里是可以来回切换模式的,而且切换后上下文不会中断。有一个性价比极高的玩法——先用快速模式快速获取基本信息,发现回答不够精准或逻辑有漏洞时,当场切到专家模式,输入“请对我刚才的问题进行深度推演,检查是否有逻辑矛盾或遗漏”。这样相当于先用快车赶路,再换慢车精读,效率和深度兼得。另外,专家模式初期不支持文件上传,但4月9日已经更新支持了,单次最多传50个文件、每个100MB。-
R2开源:550万美金干翻百亿投入
如果说V4是DeepSeek的旗舰产品,那R2就是它的技术宣言。
2026年5月16日,DeepSeek发布R2开源模型——670B参数的MoE架构,多项基准超越Meta的LLaMA 4。最夸张的是训练成本:仅550万美元。
要知道Meta砸了数十亿美元做LLaMA系列,DeepSeek用不到六百万美金就做到了全面超越。这已经不是弯道超车,这是换道超车。R2发布后,HuggingFace 24小时下载量突破50万,又一次验证了“技术宅改变世界”的剧本。
找找AI独家小技巧:R2专门针对手写体识别做了优化。以前处理扫描件里潦草的发票数字,AI经常把“3”认成“8”。实测R2在处理手写体表格时,准确率高得离谱——截图上写着“办公用品 叁佰贰拾”,它自动转成数字“320”,而不是傻乎乎地复制“叁佰贰拾”。连歪歪扭扭的数字都能看懂,打工人做报表的效率直接起飞。
识图模式:DeepSeek终于学会“看”了
DeepSeek一度是“纯文本战神”——能读,但不会看。
这个短板在2026年5月被补齐了。DeepSeek大范围开放“识图模式”,正式跨入图文交互时代。-
在实测体验中,用户可以直接上传图片让DeepSeek“看”世界,能力边界远超简单的文字提取。它不仅能识别出图片里的文字内容,还能描述画面元素、分析视觉构成。-
不过需要区分:识图模式依托的是快速模式下的视觉理解能力;专家模式下虽然也支持文件上传,但目前只能通过OCR识别文字,不具备原生视觉感知能力。-
找找AI独家小技巧:上传图片给DeepSeek做OCR时,建议选择分辨率不低于800×600、画面端正、文字清晰、无强反光的图片,识别准确率最高。如果是扫描版的PDF,它支持自动转为单页图像序列,不需要你手动导出每一页再上传。-
价格:AI圈的“价格屠夫”
说了这么多功能,最后聊聊大家最关心的——价格。
DeepSeek在定价这件事上,走的是“把门槛打到地板”的路线。V4 Flash版本的输出价格低至2元/百万Token,这个价格不到GPT-5.5输出定价的百分之一。
更有意思的是最近的一连串动作。4月26日,DeepSeek发布API价格调整公告,全系API输入价格降至首发价的十分之一,V4-Pro叠加限时2.5折优惠。原定6月恢复原价,结果5月22日又宣布:直接永久降价到原价的四分之一。
调整后:每百万Token输入(缓存命中)0.025元,输入(缓存未命中)3元,输出6元,创全球大模型价格新低。你没看错,输出单位是“元”而不是“美元”。
找找AI独家小技巧:使用API开发时,注意利用“缓存命中”的计费优势。如果你的应用场景是大量重复或相似查询,建议设计合适的缓存策略——命中状态下每百万Token只要两分五厘钱,相当于无限接近零成本。另外,V4系列全面兼容OpenAI和Anthropic两套接口协议,开发者只需将请求中的model_name参数替换为deepseek-v4-pro或deepseek-v4-flash,即可实现无缝接入,迁移成本几乎为零。
DeepSeek还不够完美的地方
说实话,DeepSeek不是没有短板。
最大的问题是稳定性。就在2026年5月28日上午,大量用户反馈DeepSeek服务出现异常,网页对话和API都中断了。对重度依赖API的开发者来说,这种突发事件会影响用户体验。
多模态深度不足也是一个待解决的问题。V4预览版暂不支持图像识别,用户期待的“看图说话”“图像问答”等功能还需要等后续版本。虽然5月已经开放了识图模式,但这还只是起步阶段。
另外,有评测指出:用户期待的是一个能陪人深聊、能抓住本质的思考者,而目前DeepSeek交付的是一个能力增强但深度可能还不够的模型。在复杂社会议题面前,它的推理链条有时还不够坚韧,细节容易丢失。
还有一点是真实幻觉问题。2025年时曾有评测指出R2在使用过程中幻觉体验问题十分严重。虽然V4系列引入了多维度验证机制,在开放域问答场景中幻觉发生率从18%降至9.3%,但在专业领域(如医疗、法律)的垂直任务中,仍需配合领域知识库进行后处理。
谁适合用DeepSeek?
如果你是开发者——DeepSeek可能是目前性价比最高的选择。百万Token两分五的输出价格,兼容主流通用API协议,再加上开源的R2模型,无论是做小规模测试还是大规模部署,成本压力都可以忽略不计。
如果你是高频用户——每天要处理大量文档、写代码、做报表,DeepSeek的1M上下文和Agent能力能显著提升效率。快速模式和专家模式的灵活切换,让你在不同场景下都能找到合适的AI助手。
如果你是追求极致性价比的普通用户——DeepSeek网页版和App目前完全免费,不限次数,没有什么明显的使用门槛。日常咨询、翻译、写作、信息整理,快速模式都能秒回搞定。
但如果你需要的是高稳定性服务、深度多模态能力(比如频繁需要“看图说话”或视频生成),或者需要在复杂社会议题上做深度讨论——DeepSeek目前可能还不是最成熟的选择。在这些场景下,元宝或豆包的多模态生态会更从容一些。
总的来说,DeepSeek让AI圈学会了一个新词——“极致性价比”。它不是最能聊的,也不是最能看的,但它是目前最能干活的,而且价格几乎可以忽略不计。
至少对我而言,需要处理大量代码、分析超长文档、或者在开发者场景中批量调用API的时候,DeepSeek已经是首选工具了。