在去年12月,由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起巨大波澜,它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能。时隔不到一个月,DeepSeek又一次震动全球AI圈。
1月27日,随着DeepSeek推出新模型DeepSeek-R1,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
那么,DeepSeek究竟好在哪?为什么能以较低的成本取得“大力出奇迹”的效果?
性能卓越,用户体验佳
DeepSeek是一款由国内人工智能公司研发的大型语言模型,简单来说,它就像是一个聪明又懂你的助手。它拥有强大的自然语言处理能力,能够理解并回答你的问题,就像你和朋友聊天一样自然流畅。
而且,DeepSeek不仅能聊天,还能帮你写代码、整理资料,甚至能帮你解决一些复杂的数学问题。它背后有着复杂的算法和大量的数据支持,就像是一个经验丰富的侦探,能从海量信息中挖掘出你想要的东西。
关于类似的大模型,最广为人知的可能是OpenAI开发的ChatG-PT。从2024年9月OpenAI发布o1-preview到现在,仅过去不到4个月,市场上媲美甚至超越其性能的推理模型就已遍地开花。
DeepSeek之所以可以从这众多的模型之中异军突起,是因为它不仅率先实现了媲美OpenAI-o1模型的效果,更是将推理模型的成本压缩到了极低。
“从大力出奇迹到小力出奇迹”
DeepSeek模型发布后,瞬间引发了海外AI圈众多科技大佬的讨论。
当地时间1月27日,受DeepSeek冲击,美国人工智能主题股票遭抛售,美国芯片巨头英伟达(NVIDIA)股价历史性暴跌,纳斯达克综合指数大幅下跌。
英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示,“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek持续引发业内震动,脸书母公司Meta已成立专门小组展开研究和学习。
北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek最大的优势在于它算法的改进和优化,它在算力上得到了节省,在输入数据和语料库上,不像以前要求那么大的数据量和大的算力,这是它的优势。以前如果说OpenAI是“大力出奇迹”,那么DeepSeek就是“小力也可以出奇迹”——小的算力用新的方法也可以出奇迹。
在南京大学人工智能学院教授俞扬看来,DeepSeek站在前人的基础上,在算法上进行了相应的优化,使得训练成本得到大幅降低。在DeepSeek的公布的技术方案中,它的强化学习也使用了这种简化方案,这就使得技术上有很多可改进的地方。
开源是否是未来的发展方向?
此外,值得关注的是,DeepSeek采用了完全开源策略。
曾经OpenAI创立的初衷,也是作为一家非营利组织,希望“以最有可能造福全人类的方式推进数字智能发展,而不受产生财务回报需求的限制”。然而,OpenAI在GPT-3发布之后限制了对模型的访问权限,仅通过API提供服务,在GPT-4发布之后更是隐藏了其训练数据和模型权重、完全走向了“闭源”。
DeepSeek的完全开源策略不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,他们可以在GitHub等平台上自由获取和修改模型代码,共同推动AI技术的发展。
英伟达AI科学家JimFan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。
国内的某大模型创业企业的CEO陈里奥告诉记者,开源的好处是显而易见的。这种开放式的创新模式可以激发更多的创意和灵感,推动AI技术的不断进步。
陈里奥表示,大模型目前还是属于技术早期,目前在生文、生图上做得多一些。高精准的逻辑计算、数学、编程类工作,还没有完全在大模型层面完成。但也正是因为处在技术早期,大家一起贡献才能让行业发展得更快。
当然,开源也面临着一些挑战和问题。例如,如何保护知识产权、如何维护开源社区的秩序和稳定等。
延伸阅读
OpenAI全面开放ChatGPT搜索功能
2月6日凌晨,OpenAI宣布了一项重大决定:向所有用户开放ChatGPT搜索功能,并且无需注册即可使用。这一消息迅速引发了全球范围内的广泛关注和讨论,标志着搜索引擎市场迈入了一个全新的发展阶段。
OpenAI的这一举措不仅改变了用户获取信息的方式,也对传统搜索引擎的商业模式构成了挑战。自2022年OpenAI发布ChatGPT模型以来,AI技术开始受到普通用户的广泛关注,并引发了市场的大量投资。此次ChatGPT搜索功能的全面开放,将进一步推动AI技术在商业应用中的落地和发展。
第一波用DeepSeek“搞钱”的人出现了
DeepSeek作为一款开源、免费的大模型,尽管还未实现盈利,但第一批用它“搞钱”的人已经出现了。
“如何用DeepSeek赚到100万”“DeepSeek带你躺着赚钱”……在社交媒体上,诸如此类的“教程”频频出现,在购物平台上,甚至还有不少商家打着“本地部署”的概念兜售DeepSeek接入教程,标价最高达到10万元,最低仅有0.01元。
记者查询发现,某热门DeepSeek社区会员费为61元,总会员数超过3600人,在DeepSeek爆红的近1个月里,仅会员费收入就超过18万元。
对于各类利用DeepSeek牟利的投机者,2月6日晚间,DeepSeek官方发布声明:目前除DeepSeek官方用户交流微信群外,从未在国内其他平台设立任何群组,一切声称与DeepSeek官方群组有关的收费行为均系假冒。
“卖的就是信息差”
DeepSeek最大的特点就是开源,而在多家电商平台上,有商家公然售卖可以免费下载的DeepSeek软件,并且不加掩饰地告诉记者:“卖的就是信息差。”
无论是元宇宙、Sora还是DeepSeek,每当新一波革命性技术引发舆论热议,似乎“卖铲子”的人总是最先挣钱。据新榜数据显示,近7天内,在各大社交平台上,和DeepSeek相关的内容作品数至少在105万条,日均作品数超15万。
除了传统的售卖AI培训课、AI社区付费等套路,售卖DeepSeek本地部署教程成为新的掘金方式,不少商家挂出5万元、10万元高价。
所谓的本地部署,就是把DeepSeek模型下载到电脑上,然后用电脑的显卡进行推理。一商家告诉记者,标价5万元是包含主机的价格:“DeepSeek对硬件要求很高,一般普通电脑根本跑不了完整版本。”
这些商家显然就是利用DeepSeek可以本地部署的幌子,真正目的是销售硬件,但性价比如何,一般用户无法判断。
“网课”泛滥普通人有必要学吗?
新技术走红,紧随其后的是各种“培训课”泛滥。学习人工智能一定要付费吗?消费者如何甄别纷繁的网课?
有消费者发现,目前,不少所谓的培训课程是互联网信息拼凑而成,课程内容的质量参差不齐,甚至只是以“人工智能”的名义赚取培训费而已。
打开各大社交平台,关于DeepSeek的相关教程层出不穷,从如何使用DeepSeek的基础概念,到教授如何使用指令集、提示词更好地命令DeepSeek,再到如何用其做电商运营赚钱。这些课程的价格从9.9元到599元不等。
某“教程”声称,有人通过教别人用DeepSeek做自媒体账号,收费599元,目前已经赚了1万多元,“你刷短视频的时间,别人用它赚钱”。还有一些“AI训练营”课程,号称可以帮助用户用AI赚取人生第一桶金,靠AI出方案“搞定甲方”……
中国通信标准化协会互动媒体标准推进委员会副主席、互联网与信息科技专家包冉向记者介绍,普通用户根本不需要去购买所谓的教程,因为使用DeepSeek不需要再像之前一样打磨提示词。现在各大主流AI都可以直接用自然语言与其交流。
此外,“DeepSeek爆火,培训课火热”的类似情况并不少见。此前,区块链、元宇宙、ChatGPT等概念大火时,都有过类似培训课程的出现。这背后既有市场需求的推动,也有一些人在追求短期利益,消费者需要仔细甄别课程质量和性价比,避免被夸大其词的宣传所误导。其次,可以通过自学、参与开源社区等方式,来获得DeepSeek相关知识和经验。
注意鉴别“假网站”
最近,DeepSeek现象级爆火,钓鱼黑产也盯上了它的高关注度。记者从奇安信XLab实验室获得的报告显示,近期,不少仿冒DeepSeek的网站、钓鱼网站大量出现,公众还需提高警惕、注意鉴别。
根据报告显示,有人瞄上DeepSeek的“黑产”,用“山寨”来传播恶意软件、窃取个人信息或骗取订阅费用;还有人紧跟技术潮流,推出所谓“DeepSeek加持”的各种高大上功能的空气币(无实质价值的虚拟货币);甚至出现宣称可购买DeepSeek内部原始股的网站。
对于普通用户,网络安全专家、北京汉华飞天信安科技有限公司总经理彭根认为,识别假冒网站的难度和鉴别电信诈骗一样有些高。这个问题“比较无解”,只有加大宣传力度。他建议用户使用一些可以识别并提示假网站的浏览器,看到相关提示千万不要忽略。不要轻易输入密码或转账。
本版文字综合央视网、澎湃新闻、中央广电总台中国之声、齐鲁壹点、红星新闻