《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值为数亿元人民币。
袁进辉告诉《晚点 LatePost》,他和 OneFlow 核心团队从 2023 年 8 月开始筹备再次创业,新公司延续 OneFlow 的方向,做 AI Infra(AI 基础设施)层中的 “框架”。
晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资大模型训练框架方向,想象空间不大,目前来看,做pretrain的需求可能只会局限于几个头部大公司。比较有机会的是,由于N卡的禁运,国产卡有崛起的趋势,国产卡软件适配方向应该还有1到2年的红利可吃,但是和创业公司关系不大,更多的是国产卡厂商要建立自己的软件部门围绕自己的硬件建立相关生态体系。
推理方向,很早有行业大佬在布局,目前推理方向的技术发展也较快,比较看好的机会是大模型应用铺开后,推理的成本会成为大模型应用成败的关键因素之一。而推理优化的技术难度相对较高,建立自己的推理团队难度大成本高,因此成熟的推理体系产品势必会是大模型应用型创业公司的选择之一。
感谢关注。
北京硅动科技有限公司(以下简称“硅基流动”)于近日完成5000万元天使轮融资。本轮融资由创新工场领投,耀途资本、奇绩创坛以及王慧文等科技界知名人士跟投,华兴资本担任独家财务顾问。
随着ChatGPT的爆火,生成式AI快速发展,全球算力需求随之爆发式增长,由此导致算力供给严重不足。高昂的算力成本和应用开发门槛成为生成式AI发展的主要瓶颈。
成立于2023年8月的硅基流动致力于打造大模型时代的AI基础设施(AI Infra),降低大模型应用成本和开发门槛,加速AGI普惠人类。硅基流动由袁进辉博士(一流科技创始人、光年之外联合创始人)创办,当前多数成员来自一流科技(OneFlow),是世界上研发分布式深度学习框架的唯一一支创业团队。基于在AI Infra领域的深厚积累,以及驾驭万卡集群的技术能力,硅基流动率先推出了业内极具竞争力的AI Infra商业化方案,主要包括三个层面。
第一,高性能大模型推理套件,主要包括SiliconDiff和SiliconLLM。SiliconDiff是一个开箱即用的高性能文生图/视频加速库,支持上层主流应用框架Diffusers、ComfyUI、SD-WebUI,对文生图模型SDXL的性能加速最高可达3倍,在大幅提升使用体验的同时降低了应用成本。比如,如果AIGC企业想用SDXL提供服务,需要达到每秒800张图片的生成速度,当使用未优化的基准引擎,基于A100平均3秒生成一张图片,那么需要2400张A100 GPU提供服务,租用费用为300万美元/月,当使用SiliconDiff加速引擎,基于A100平均1秒一张图,那么仅需要800张A100 GPU,租用费用为100万美元/月。
SiliconLLM是一个高效、易用、可扩展的语言大模型推理加速引擎,让用户开箱即用,显著降低部署成本,加速生成式AI应用落地。通过算子、机制、框架与模型等层面的联合优化,在各种语言大模型推理场景中,相比其他同类产品,SiliconLLM的性能加速最高可达10倍。
第二,云服务平台SiliconCloud,提供高性能、低成本的MaaS/PaaS/IaaS服务。SiliconCloud以云原生AI应用开发平台为底座,以高性能推理套件为内核,通过汇聚各领域的优质模型,并由硅基流动团队专门加速,最终让AI开发者与用户能够零门槛开发和使用模型,实现应用需求方和开发者能力的快速对接。
第三,一站式AI应用开发平台SiliconBrain,这是面向AI应用开发者的私有化部署方案。基于可提高工作流效率的DevOps原理和做法,SiliconBrain能做到持续集成、持续交付和持续部署,帮助企业AI团队形成标准协作方式,实现企业AI应用快速落地。
目前,硅基流动的大模型推理方案已进行初步推广,并积累了多家海外头部AIGC付费客户,同时还与其他业内大模型企业、算力企业开展有序合作。
硅基流动创始人袁进辉表示:“高企的推理成本是实现大模型无处不在这一愿景的主要障碍。作为世界上最擅长解决这一挑战的企业之一,硅基流动的使命是通过算法、系统和硬件的协同创新,将大模型推理成本降低几个数量级,从而加速AGI普惠人类。目前,我们已发布全球领先的大模型推理系统。今年,视频生成和大模型应用将迎来井喷式增长,我们将加快产品化和商业化进程,以最快的速度向全球客户提供最优质的产品。我们非常高兴得到像创新工场、耀途资本、奇绩创坛、王慧文等“懂技术、信市场、有全球视野”的投资者的支持,我们一定全力为股东创造最大回报。同时,感谢华兴团队在本轮融资中专业细致和卓有成效的工作,他们的贡献不止体现在融资工作上,更是创业者的合伙人。”
创新工场执行董事兼前沿科技基金总经理任博冰表示:“AI2.0在持续快速演进,一方面模型在遵循Scaling Law持续变大,且开源生态大幅提升了模型渗透速率;另一方面应用也进化到了Agents、多模态等需要更高算力调用需求的产品形态,推理成本严重阻碍了应用的推广效率和模式创新。行业极度渴求更快、更便宜的推理算力,但系统级端到端的优化有很大的技术难度和工程量。硅基流动拥有世界级的技术团队、业内顶尖的全球商业化能力和第一次成功创业的收获。创新工场已经孵化和投资了十多家大模型、AI Infra和AI2.0应用公司,非常认可硅基流动的能力和愿景,期待公司能在未来几年内带来几个数量级的算力成本下降和性能优化能力,为AI2.0的普惠提供强大助力。”
我们正在招募技术研发、产品经理、市场、销售等各类人才,期待与你一起乘风破浪,探索AGI征途上的星辰大海。
(商务洽谈、技术交流请添加微信小助手:siliconflow01)
简历投递:
商务合作:
硅基流动官网:http://www.siliconflow.com
硅基流动是袁进辉的第二次创业。步入中年的袁进辉仍抱有一腔投身时代变革的赤诚,“如果不继续出来创业,可能时代与我们就没有什么关系了”。这种不服输、不甘心的劲头,支撑他走过一次次职业变动与波折,最终将他塑造成一名兼顾技术理想与商业现实的成熟创业者。
比风口更早的人
2003年,袁进辉进入清华大学计算机系攻读研究生,博士期间师从中国人工智能奠基者张钹院士。自此,他始终在智能这一领域中扎实前行。博士后阶段,与心理学、脑科学等交叉学科的碰撞,使他从那个深度学习尚未进入大众视野的年代开始,便在心中埋下了大模型理念的种子。
人脑拥有大约千亿个神经元,每个神经元与成千上万个其他神经元相连接,构成一个连接规模远超当前大多数大模型的庞大神经网络——正是这样的思考,使袁进辉在当时就做出了一个极具前瞻性的判断:如果要让智能真正“涌现”,模型不仅要做出来,还必须做大。
“这是一种信念,我们认为这件事(大模型)一定会发生。”袁进辉说。
从科研体系中走出、又在业界工作了几年之后,2016年,袁进辉创立了“一流科技”,正式开始将他关于大模型的设想投入实践。
要研发一个远超当时主流框架的大模型训练系统,周期长、成本高,甚至连“有没有用”都是悬而未决的问题。从行业主流眼光来看,这更像是一场孤注一掷的“实验”,初创公司资源有限,投资人难以理解,盈利遥遥无期。袁进辉却始终没有动摇。
“那时国内好多学生给人的印象是,擅长解决问题,不善于提出问题……我最初是想成为提出原创问题的科学家。”他有着精准判断力和极强执行力,目标从不是“赶风口”,而是“先看清楚风往哪儿吹”。
PyTorch借鉴了OneFlow的技术方案
从对智能本质的好奇出发,为大模型训练提供**软件的想法在袁进辉心中愈发坚定,并在实践过程中逐渐生根发芽。七年间,一流科技从一项几乎无人相信的“实验”起步,到其提出的技术路线被全球应用最广的深度学习框架PyTorch所采纳,再到ChatGPT-3.5问世后大模型的概念走入大众视野,袁进辉当年的“**识”判断,最终演变为全行业的“超级共识”。
创业的道路注定不平坦。当“人工智能”成为老少皆知的热词,行业竞争急剧加剧。2023年,一流科技团队加入王慧文创办的“光年之外”,袁进辉担任联合创始人。不久后,光年之外被美团收购。在经历了一连串的组织变化后,他与原班人马再次出发,创立了“硅基流动”。
短短半年内,团队如坐过山车般换了四家公司。如果说创业是一场马拉松,那袁进辉刚刚抵达一个终点,抬头却已望见了下一个起点。
“挑战会一直存在……如果我们不继续出来创业,可能AI浪潮与我们就没什么关系了。”面对行业内递来的高薪“橄榄枝”,他和团队没有选择就此“躺平”。他们没有忘记最初的好奇心,不甘心、不服输,每一次问题的解决都带来新的经验。技术浪潮的窗口期亟待把握,时代的机遇需要牢牢抓住,因而他们绝不会轻易放弃。
硅基流动创立之初,绝大多数核心成员选择留下。这是长期合作所凝聚出的认同感与信任,是一群始终坚守理想的探索者们难凉的热血。
保持“流动”的能力
谈及理想中的“终点”,袁进辉想要做出改变世界的产品,他相信,如果为用户创造足够价值,商业回报自然会随之而来。如今的硅基流动,也坚持着产品导向,致力于打造一个“开箱即用”的低门槛AI云服务平台,用技术为产品赋能,面向开发者以及企业、政府等客户提供稳定服务。
硅基流动大模型服务平台
作为平台核心产品,硅基流动大模型服务平台拥有多项显著优势:其基础服务能力强,得益于长期的技术积累与团队构建,在同类产品中优势明显;性价比高,提供多款大模型的永久免费服务,被用户戏称为“赛博菩萨”;此外,硅基流动坚持“中立”原则,不自产模型,上线的模型种类全面,始终扮演着技术服务者的角色。正是凭借这些差异化特点,硅基流动在竞争激烈的大模型行业中,走出了一条属于自己的路径。
2025年初,DeepSeek-R1模型的发布迅速引发关注,成为全球AI社区热议的焦点,也为硅基流动带来了“泼天”流量和“出圈”机会。在DeepSeek最炙手可热的时期,只要平台拥有相关服务,无需任何推广,用户便会自发涌入。
硅基流动联合华为云推出基于CloudMatrix384超节点昇腾云的DeepSeek服务,用户体验和性价比达到国际主流GPU水准
机会总是留给有准备的人。早在DeepSeek-R1发布前,硅基流动便在自有社区中捕捉到部分开发者的讨论,判断DeepSeek初代模型具备出色的编程能力,迅速投入资源进行适配支持。等到DeepSeek-R1在2025年1月正式上线并迅速走红时,硅基流动联合华为云昇腾云率先推出基于国产芯片的DeepSeek-R1模型服务,其性能表现比肩国际顶尖GPU。
服务上线初期,DeepSeek带来的流量远超预期,硅基流动大模型服务平台的系统负载一度接近极限。为保障服务稳定交付,团队在春节期间连续奋战、全员无休,用“边开飞机边换引擎”的节奏迭代产品,抓住了这波爆发式增长的窗口期。
对DeepSeek潜力的前瞻判断,加上高效的执行力,将袁进辉和他的团队推向新的高点。如今,其大模型服务平台的总用户数突破700万,服务了数千家企业,成为全球增长速度最快的第三方AI云服务平台。
袁进辉将“增长”视为2025年最重要的关键词。年初的爆发看似偶然,实则是多年积累与判断的自然释放。接下来的增长,则是更广义的多维建设:技术上,持续聚焦行业核心需求,打造对开发者真正有价值的产品;商业上,围绕市场反馈不断迭代、拓展服务边界,形成可持续的商业模式;人才上,寻找具有自驱力、执行力和热情的团队成员,不仅懂产品,更能用“用户听得懂的语言”讲好模型服务的故事。
与此同时,如何在国际市场中找到自身的定位,也是硅基流动“增长”路径的重要一环。这是一条更长的增长曲线,也是一条更具挑战的战略路线。
走通“用得好”的路
面对当下的算力受限环境,袁进辉表达得很坦率:如果没有外部限制,企业当然希望选择市场上最成熟、最先进的产品,比如发展得更早、生态更完善的英伟达算力系统。
但如今,人工智能已成为全球竞争中的关键领域,国内企业要使用先进算力却不断面临诸多限制,在这样的背景下,想要获得持续、稳健的发展,“我们必须找到自己的路。”
对袁进辉而言,发展国产AI基础设施不仅是对当前形势的回应,更是一条必须走通的路。即便国产算力早期存在性能差距、生态尚不成熟,但“这是一个行业、一个国家必须面对的重大问题,即使困难重重,也必须有人解决……如果有企业解决了这个问题,就能拿到市场的回报。”
基于这样的判断,硅基流动于2024年深度适配国产算力,为用户提供稳定可用的大模型服务。在行业普遍面临算力紧张的背景下,由于国产算力相对“不抢手”,反而资源充足、调度灵活,成为硅基流动能够稳定掌控、灵活部署的优势资源。
在他看来,当前国产硬件仍处于追赶阶段,不论是芯片制造、软件生态,还是分布式架构,仍有不少“坑”要踩。但令人欣慰的是,越来越多国内厂商已经加入自主研发的道路中,逐步攻克了7纳米级别的生产难题,也在技术路径上开辟出新的方向。例如,通过芯片互联打通算力节点,构建高效的分布式集群。“像华为提出的超节点技术,就是其中一种思路,我们也在上面做了一些工作。”袁进辉说。
底层能力的突破最终由需求牵引。袁进辉相信,在广阔的中国市场中,AI应用的丰富场景、庞大的开发者群体和日益成熟的产品意识,将反过来促进底层能力的提升——“只是时间问题,追上行业脚步是迟早的事。”
正是在这样的行业环境下,硅基流动不断推进自身产品体系的构建。他们以平台化能力为核心,将国产算力从“毛坯房”打造成“拎包入住”的服务空间,让用户感知不到底层硬件的差异,获得与使用国际高端GPU类似的体验。在解决行业问题的过程中,硅基流动也找到了属于自己的技术路径和商业价值。
团队合影
硅基流动始终沿着清晰的判断稳步前行,追求的不是短期话题的热度,而是技术真正造福社会的长期价值。这也是袁进辉和他的团队始终坚持的方向。
科研、创业、回应世界,过去的每一次高峰与低谷,都积淀为未来蓬勃生长的沃土;身份、阶段、标签,从未动摇那颗为技术跳动的初心;好奇、判断、执行,终将构成属于他们的科技足迹,在时代的穹顶之下,留下掠影,也照亮路径。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/247501.html