您现在的位置是:知识 >>正文
DeepSeek朝硅谷“开了一枪”
知识1人已围观
简介《科创板日报》1月27日讯记者 张洋洋)几乎是一夜之间,“来自东方的神秘力量”又一次击中海外人士心脏。近两日,国产AI黑马DeepSeek深度求索)在全球科技界刷屏。新模型发布后的访问量激增,一度让D ...
《科创板日报》1月27日讯(记者 张洋洋)几乎是开了一枪一夜之间,“来自东方的朝硅神秘力量”又一次击中海外人士心脏。
近两日,开了一枪国产AI黑马DeepSeek(深度求索)在全球科技界刷屏。朝硅新模型发布后的开了一枪访问量激增,一度让DeepSeek闪崩,朝硅但问题在数分钟内得到解决。开了一枪AI界上一次出现宕机情况,朝硅还是开了一枪月之暗面的Kimi出圈爆火之时。
截至发稿,朝硅DeepSeek在美区苹果App Store的开了一枪免费排行榜中飙升至第二,第一是朝硅ChatGPT。
▍与OpenAI“掰手腕”
DeepSeek本次“刷屏”,起因是朝硅1月20日其正式发布推理大模型DeepSeek-R1,该模型在数学、开了一枪编程和推理等关键领域的表现,能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。
DeepSeek-R1的惊艳表现,先是引发了海外市场的强烈关注。在美国,多位AI行业的资深专家和从业者盛赞DeepSeek-R1。
美国计算机科学家、萨姆·奥尔特曼的导师吴恩达在第55届世界经济论坛(冬季达沃斯)上点赞DeepSeek——“我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型,非常出色……‘加油’!”。
微软CEO萨蒂亚·纳德拉也公开表示,“他们(DeepSeek)切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”纳德拉还强调,“我们必须非常、非常认真地对待中国的这些进展”。
DeepSeek成立于2023年5月,其背后是国内对冲基金巨头幻方量化。
2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeek LLM上线,其参数规模达到 67B,性能接近 GPT-4,同时还发布了该模型的聊天版本 DeepSeek Chat。
真正让Deepseek在AI界出圈的,是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被称作“价格屠夫”、“AI界的拼多多”。
随后的2024年下半年,这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。
到了2025年推出的R1模型,在数学能力测试中,该模型在MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。
而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。
▍为何是DeepSeek?
在国内7家头部的大模型创业公司当中,DeepSeek可以说是最不显山不露水的一家。在各个大模型厂商早已开启买量,进行广告投放品牌营销时,据《科创板日报》记者了解,这家公司至今尚未有公关团队。
2023年4月,幻方量化宣布成立新组织,集中资源和力量,探索AGI的本质。当时幻方就表示,多年以来,公司坚持把营收的大部分投入人工智能领域,建设领先的AI硬件基础设施,进行大规模的研究,探索人类未知的奥秘。
如今来看,在这一年多时间里,DeepSeek的进展迅速。当下的AI战事进入中场,战况尤为激烈,为何是DeepSeek先让硅谷 “慌了神”?
近期,在微信朋友圈中,《科创板日报》记者注意到,不少AI领域的从业者和投资人,对此进行了分析讨论。除了技术实力本身,团队的创新理念和人才队伍,是业内人士认为DeeSeek能在群狼环伺的AI界杀出重围的主要原因。
幻方量化和DeepSeek创始人梁文锋,毕业于浙江大学信息与通信工程专业。业内口碑称,这是一位极致的80后技术理想主义者。创立幻方,梁文锋就在幕后潜心钻研技术,在DeepSeek时代,其依旧延续着低调作风,和一线研究员一样,每天“看论文,写代码,参与小组讨论”。
“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”在接受《暗涌》的采访中,梁文锋说。
DeepSeek的招聘公告中,赫然写着“顶尖人才招聘”。公开信息显示,目前的DeepSeek团队,集结了一批国内名校毕业的高密度年轻人才,其中不乏应届生、实习生。在这里,工作经验不再是衡量人才的唯一标准。DeepSeek的HR在社交媒体平台表示,“着重考察人选素质和对大模型的热爱”。
只要员工的技术提案有潜力,他们所需算力和资源都能得到充分满足。在大模型领域,算力是稀缺的资源,DeepSeek则是“万卡GPU训练集群,无需申请,不限使用”。
对于这些人才,多名熟悉DeepSeek的AI业内人士也反馈,给出的薪酬极具竞争力。
“投身于探索 AGI 的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题”,这是DeepSeek官方微信号写下的简介。某种程度上,DeepSeek代表了中国“硬核技术创新”的叙事。可喜的是,DeepSeek并非孤例。
前不久,宇树科技发布了一段最新机器狗产品B2-W的演示视频,视频中B2-W机器狗展现了一系列高难度动作,这引来马斯克点赞转发评论,火爆全网。
几乎是在一同期,黄仁勋的英伟达中国年会之行中,宇树科技CEO王兴兴受邀参与,一行人当中,还有银河通用创始人兼CTO王鹤、深涌智能Emerging AI创始人黄可铖等。
以这些硬核技术的创业者和公司为代表,他们正在开启一个中国创新故事的新篇章。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“画地成牢网”。http://www.tj-baode.com/html/26c741292561.html
相关文章
吴劲走访慰问退休老同志和困难党员群众等_
知识滁州网讯通讯员施正言 全媒体记者张开兴)新春佳节即将来临之际,1月25日,市委书记吴劲来到部分“中国好人”、全国劳模、困难党员群众、退休老同志家中,开展春节前走访慰问。市领导杨 ...
【知识】
阅读更多全国重点文物保护单位南安中宪第古厝大修
知识-始建于清朝雍正年间的泉州南安中宪第古厝,迄今约有280年历史,系全国重点文物保护单位。然而,中宪第历经岁月洗礼,虽几经修缮,仍存在屋面漏雨严重、木构件糟朽严重、违章搭建杂乱无章、墙体局部坍塌倾斜等问 ...
【知识】
阅读更多“美国的至暗时刻”?特朗普豪宅遭FBI搜查
知识8月8日,安全人员聚集在美国佛罗里达州棕榈滩的海湖庄园外。 新华社/路透/图)“我的住所挤满了一大群联邦调查局FBI)特工……他们甚至撬开了我的保险柜。”当地时间2022年8月8日,美国前总统特朗普发 ...
【知识】
阅读更多
热门文章
最新文章
友情链接
- 舞台剧《钢之炼金术师》第2弹公演制作决定!明年推出
- 阅文好物将在 2023 CJTS & CJFM 专区亮相
- 想看美女落泪!盘点动漫中哭颜让人印象深刻的角色
- 加州大学圣塔芭芭拉分校文理学院
- 罗切斯特大学商业分析面试
- 南卫理工大学的奖学金一般有多少?
- 橱柜行业发展三大特征分析
- 《瑞克和莫蒂:日漫版》预告公布 由佐野隆史执导!
- 《长安三万里》曝将进酒特别视频 票房突破2.8亿!
- 芬威克主教高中怎么样
- 《少年JUMP》创刊55周年《火影忍者》波风水门外传 纪念PV
- 波士顿大学传媒硕士专业
- 密西根州立大学统计学博士
- 动画《猪肝倒是热热再吃啊》第一弹PV公布!10月开播
- 加州大学圣塔芭芭拉分校文理学院
- TV动画《葬送的芙莉莲》将于今年9月29日开播
- 想看美女落泪!盘点动漫中哭颜让人印象深刻的角色
- 不再疯狂烧钱的文娱环境里,国漫如何拥抱春天?
- 多样化的营销模式为橱柜企业发展注入新活力
- 南卫理工大学的奖学金一般有多少?
- 罗斯霍曼理工录取难度如何?
- 舞台剧《钢之炼金术师》第2弹公演制作决定!明年推出
- 快把《JOJO》续上!希望动画化的完结漫画TOP12
- 快把《JOJO》续上!希望动画化的完结漫画TOP12
- 细数:这些年卫浴行业正在经历的“伤”
- 斯坦福大学申请截止日期
- 大学预科平均分90可读专业?
- 舞台剧《钢之炼金术师》第2弹公演制作决定!明年推出
- 《少年JUMP》创刊55周年《火影忍者》波风水门外传 纪念PV
- 明尼苏达大学MBA项目学费
- 低价促销扎堆 木门企业发展出路在哪
- 《魔王学院的不适合者》第二季新视觉图公布!已开播
- 知名儿童文学《窗边的小豆豆》动画电影海报 预告
- 《境界战机 极钢的装鬼》将于8月开播!主视觉图公布
- 杜克大学Fuqua国内就业
- 明尼苏达大学MSBA
- 明尼苏达大学MSBA
- 明尼苏达大学MSBA
- 实木橱柜为抓住潜在客户 大胆亲民年轻化
- 杜克大学Fuqua国内就业