浙大天才，震惊全球【双一流吧】

双一流吧关注：86,350贴子：3,795,855

1 2 3 下一页尾页
31回复贴，共3页
，跳到页

浙大天才，震惊全球

2024年末，一位科技创业者火了。
作者 | 王思琪
2024年末，一位科技创业者火了。
2025年初，这位创业者再度爆火。
近日，中国科技行业因一位85后年轻人现身《新闻联播》，彻底爆了。他以AI初创公司深度求索（DeepSeek）创始人的身份罕见参加了一场国家超高规格座谈会，并现场发言。

送TA礼物

IP属地:浙江

1楼2025-01-28 13:10回复

IP属地:浙江

3楼2025-01-28 13:12

他发言的照片，迅速流传于各类社交平台。所有人都想听听，他分享了哪些可能改变全球科技未来趋势的深度见解。这位年轻人，就是把开源模型做到全球第一，性价比超越估值1570亿美元独角兽OpenAI的浙大天才，梁文锋。他和DeepSeek曾一夜轰动美国硅谷、震惊全球。而梁文锋及团队开发的大模型“DeepSeek-V3”则被海外称作，“来自东方的神秘力量”。

IP属地:浙江

5楼2025-01-28 13:15

第一件事，轰动硅谷、震惊全球

IP属地:浙江

6楼2025-01-28 13:16

2024年12月，一家名叫DeepSeek的杭州初创公司经过技术迭代与升级，发布了全新一代大模型，“DeepSeek-V3”。由于这款大模型太过好用，在AI发烧友圈子传播后，传到了海外社交平台、技术论坛，引发了海外网友的连连称赞。

IP属地:浙江

7楼2025-01-28 13:16

有海外网友直接拿“DeepSeek-V3”和OpenAI发布的“GPT-4o”进行比较，结论是，“两款产品不相上下”。得出这样的结论，美国硅谷的技术大牛坐不住了，他们觉得，“网友描述太过夸张”。于是，纷纷把“DeepSeek-V3”拿来使用，挑点毛病。挑来挑去，差点“跪了”。
结果，技术大牛挑了不少“GPT-4o”的毛病。这件事，在硅谷传播，成了美国科技圈的热门讨论议题。有几位硅谷AI技术扛把子，开了个分析会。研究“这个新模型是怎么做到的？”会上一些专家头大了，分析半天，给出结论，“很强，但投入成本肯定会超过OpenAI”。

IP属地:浙江

8楼2025-01-28 13:17

紧接着，美国媒体打了硅谷的脸。据报道，“DeepSeek-V3”来自一家名叫DeepSeek的中国初创公司。令人惊讶的是，DeepSeek-V3的投入研发费用，只花了558万美元。“难以想象，一款性能比肩GPT-4o的大模型，训练成本不到GPT-4o的1/20，硅谷却还在自以为是。”
看到报道，硅谷心态炸了，科技地震。有人感到羞愧，有人给出了客观声音。OpenAI早期成员安德烈·卡帕西说，“DeepSeek-V3的出现，意味着，今后也许不需要大型GPU集群来训练前沿的大语言模型了。”Scale AI华裔CEO亚历山大·王感叹，“DeepSeek-V3更强”。

IP属地:浙江

9楼2025-01-28 13:17

让硅谷更加不可思议的是，训练成本极低的“DeepSeek-V3”只用了2048张H100的GPU集群，且用时仅53天。一位美国AI行业研究员称，“同等水平下，哪怕是全球AI第一梯队的头部公司，至少也要用到1.6万张以上的GPU进行训练，真的不可思议，太不可思议了。”
一位推特网友表示，“美国科技故步自封，殊不知勤劳的中国跑到了前面。”伴随各种惊讶之声，“DeepSeek-V3”在大模型发烧友的推动下火遍全球，被认为是“来自东方的神秘力量”。
美国CNBC电视台如此评价硅谷科技地震，“一种新模式，让整个山谷都嗡嗡作响。”

IP属地:浙江

10楼2025-01-28 13:18

全球炸锅了，DeepSeek却在国内保持低调。

IP属地:浙江

11楼2025-01-28 13:18

过去一两年，AI是全球最宠溺风口，没有之一。众多细分赛道中，大模型热度靠前，是大厂、资本投入规模最大赛道。国内，大厂对大模型表现出了极度偏爱，开创了“大模型盛世”。
早期大模型的参与者就有百度、华为、腾讯、阿里巴巴、京东、字节跳动、网易等巨无霸。其中，百度开发了“文心一言”，华为有“盘古”，腾讯弄“混元”，阿里巴巴打造“通义千问”，京东上线“言犀”。不光自己干，素有“中国三大产业资本CVC”之称的腾讯、阿里巴巴、京东，相继投了一批大模型，间接折腾出牵动一二级市场、概念满天飞的“百模大战”。

IP属地:浙江

12楼2025-01-28 13:19

“百模大战”释放了“无穷大”的市场增量空间，资本、高校、创业者、科学家密集参与。

IP属地:浙江

13楼2025-01-28 13:19

大模型赛道继续分化，拆出多个分支，包括通用大模型、行业大模型、垂直大模型3大应用分类，每个大分类有小分类。根据百度文库一份报告显示，国内大模型数量超200个，覆盖芯片、新能源汽车、智能制造、医疗健康、航空航天、数字产业、金融等50多个领域。

IP属地:浙江

14楼2025-01-28 13:20

拼杀到2024年，资本聚集、表现出众的5只独角兽分别是：智谱AI、月之暗面（Kimi）、百川智能、MiniMax、零一万物。试想，在这么“卷”的大模型赛道，想要出名也不容易。反观DeepSeek，在竞争激烈的赛道，十分冷静。第二件事，才让DeepSeek渐渐浮出水面。

IP属地:浙江

15楼2025-01-28 13:20

第二件事便是，网传雷军天价招人。就在“DeepSeek-V3”轰动硅谷不久，“顶流科技网红”小米创始人雷军出手了，要做小米大模型。雷军出手非同凡响，“年薪千万元，挖角95后AI天才少女”话题引爆热搜。雷军想挖的人，叫罗福莉，她硕士毕业于北大计算语言学研究所计算语言学专业，是AI行业的天才少女。不过，后来罗福莉向媒体说，“还在考虑”。

IP属地:浙江

16楼2025-01-28 13:20

媒体“疯狂抢流”，挖出了罗福莉曾跳槽DeepSeek，参与研发了大模型“DeepSeek-V2”。一个员工都有这么大的魅力，DeepSeek创始人得有多强？就这样，浙大天才，藏不住了

IP属地:浙江

17楼2025-01-28 13:21

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

1 2 3 下一页尾页
31回复贴，共3页
，跳到页

<返回双一流吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

浙大天才，震惊全球

登录百度账号

扫二维码下载贴吧客户端