DeepSeek梁文锋:我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝 技术理想主义者的崛起

在人工智能领域,一场激烈的竞争正在上演。去年12月,国内大模型公司“深度求索”推出的DeepSeek-V3以极低的训练成本实现了与GPT-4等顶尖模型相媲美的性能,震惊了业界。不到一个月后,DeepSeek再次震动全球AI圈。

1月27日,随着新模型DeepSeek-R1的推出,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这一消息引起了广大用户对这款新兴应用的兴趣。DeepSeek创始人梁文锋逐渐被外界关注。梁文锋1985年出生于广东省湛江市,17岁考入浙江大学。值得注意的是,中国还有两位AI领域的知名人物也来自广东:Kimi创始人杨植麟来自广东汕头,人工智能领域的杰出科学家何恺明来自广东广州。

梁文锋被誉为“极致的80后技术理想主义者”,每天专注于看论文、写代码和参与小组讨论。2002年,他对数学建模充满热情,考入浙江大学电子信息工程专业,并于2010年获得信息与通信工程硕士学位。在校期间,他对金融市场产生了浓厚兴趣,特别是在2008年全球金融危机时,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,为他的职业生涯奠定了基础。

毕业后,梁文锋将目光转向更广阔的金融市场。2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了显著成绩。

2016年,幻方推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。随着业务扩展,算力瓶颈显现。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的前列。2023年,梁文锋宣布进军通用人工智能领域,并创办了深度求索DeepSeek,专注于开发真正的人类级别的人工智能。

今年1月20日下午,中共中央政治局常委、国务院总理李强主持座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。梁文锋出席此次座谈会,这被解读为国家对科技创新的重视。座谈会上,李强强调要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。

杨植麟出生于1992年,本科毕业于清华大学计算机系,拥有卡耐基梅隆大学计算机专业博士学位。他曾师从苹果公司前AI负责人,并在Facebook AI Research和Google Brain工作。2023年4月17日,杨植麟创立北京月之暗面科技有限公司(Moonshot AI)。同年10月,月之暗面宣布在“长文本”领域实现突破,推出了支持输入20万汉字的智能助手产品Kimi Chat,引起广泛关注。

何恺明是广东广州人。2015年,他和他的团队凭借152层深度残差网络ResNet-152在ImageNet图像识别大赛中击败多个业界团队,获得第一。2016年8月,何恺明离开微软亚洲研究院,加入Facebook AI Research(FAIR),担任研究科学家。2024年,他正式回归学界,加入麻省理工学院(MIT)电气工程与计算机科学系担任教职。

责任编辑:于浩淙 zx0176

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/15151.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年1月29日 上午10:25
下一篇 2025年1月29日 上午10:25

相关推荐

  • 冷空气影响北方地区 多地气温“对半减”

    今天(2月16日),冷空气东移南下,长江以北地区将迎来降温,尤其是华北、黄淮等前两天升温明显的区域气温起伏较大,多地最高气温将大幅下降,公众需及时添衣防感冒。南方多地随着阴雨减少,气温将有所回升,但明天阴雨将再度增多,外出需带好雨具,注意交通安全。 昨天,北方大部地区晴暖升级,华北平原普遍达到10℃以上,甚至超过15℃。而贵州至江南一带受阴雨影响,气温低迷,…

    2025年2月16日
    13200
  • 高速免费以驶离出口时间为准 春节8天免费通行

    随着春节的临近,高速公路迎来了较大客流。2025年春节假期期间,高速免费通行8天,从1月28日除夕零点至2月4日正月初七24点。此次免费政策适用于7座以下(含7座)载客车辆,而8座及以上客车及货车则不在免费范围内。 南京长江第二大桥指挥调度中心提醒车主,免费通行的时间依据是车辆驶离出口收费车道的时间,因此不必等到免费时段开始后再上高速。交警建议大家合理规划出…

    2025年1月27日
    13600
  • 为何“禁用”这招对DeepSeek不灵了 开源技术难阻挡

    2月5日,A股在农历新年后的首个交易日迎来开盘,DeepSeek概念股继续大涨。每日互动、青云科技、安恒信息、安凯微、天娱数科、三六零等多只股票开盘即涨停。 DeepSeek正在引发一场全球AI开源技术的变革。尽管面临安全审查,但分析人士认为其技术创新已经重要到难以被禁用,因为全球的实验室都在争相复制DeepSeek的成功。澳大利亚政府宣布禁止在所有政府设备…

    2025年2月5日
    13700
  • 手机银行APP变身“金融Siri”:你的理财顾问会是个聊天框吗

    当下,大模型技术正以“摩尔定律”般的速度迭代,国产DeepSeek大模型以开源生态掀起“技术平权”飓风,在这场生成式AI从实验室跃进产业深水区的历史进程中,金融机构的数字化命运正在被重新编码。 2月27日,一场主题为“AI赋能金融科技:金融机构如何抓住新机遇?”的金融沙龙在清华大学顺利举办,这场沙龙活动由清华大学经济管理学院区块链金融研究中心、清华大学经济管…

    2025年3月3日
    13600
  • 多个口岸迎出入境客流高峰 春节假期创新高

    全国多个口岸迎来了新一轮的出入境客流高峰。春节假期期间,深中通道车流量总计达到33.39万车次,日均车流量为9.54万车次,预计在大年初六迎来假期最高峰。 在深圳,春节假期前四天共查验了超过210万人次的出入境人员,较去年增长9.4%。随着240小时过境免签等新政的实施,出入境外籍人士接近4.3万人次,同比增长37%。 责任编辑:张小花 TT1000

    2025年2月1日
    17900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信