林俊旸的名字刷屏了一整天。
3月4日,作为阿里Qwen的开源负责人及模型的核心开发者,同时也是技术社区影响力巨大的中国AI模型厂研究员林俊旸突然发了一条推文,称自己正在离开Qwen。
紧接着是全网瞬间点燃的各种热议,以及技术社区的广泛声援。据一些Qwen团队的研究员称,这是积攒了许久的问题以最难看的形式爆发。
这几乎称得上一条x引发的大地震,它所暴露出来的问题,也足够复杂全面,每个参与讨论的从业者似乎都在讨论他们自己,都有切肤之痛,从开源的策略到一个组织的惯性,再到所体现出来的人心向背,这里面的挑战是今天所有号称自己为AI native组织的公司们都在面对的问题。
1 开源的策略
林俊旸对于Qwen开源这件事的象征意义有多强?在他的推文发布后,大家第一时间反应就是阿里的开源策略是否要生变。
但据接近Qwen团队的人士透露,在内部的沟通里,其实反而没有太多回应开源的话题。外界的担忧和第一时间内部反应的落差,指向更大的问题:开源作为中国多个厂商的策略,接下来如何持续。
开源在很长一段时间成为中国模型厂商竞争的手段,开源作为一种策略,本身有两个效用:
一是真正建立有影响力的社区,借此在整体资源依然不均衡的AI竞争中破局,
二是“我的开源已经逼近闭源”的叙事。这显然对竞争以及获取用户也有用,这也是当初OpenAI被DeepSeek冲击后,Altman说出它可能“站在历史错误一边”的重要原因。
但这个过程肯定是曲折的,所谓的逼近也会反复。在模型能力起伏时候能不能坚持,还是说在落后时挺彻底的开源,在一个阶段取得领先,被这个叙事自我感动后,认为开源都超过了闭源又何必开源,然后改变策略,会走向完全不同的结局。
这里就出现了巨大的落差,开源本身需要的开放,和竞争策略本身需要的封闭之间的冲突。林俊旸成为了某种开源社区追随的明星就是他身上体现出了各家模型厂都少有的开放感。
你可以想象,得有多大的对开源的信念,才能用如此多的精力去在一个组织森严的体系里,寻找可能的空间。他的很多分享都是以“在可以分享的尺度里尽可能分享给社区”为开头展开,任何一个尝试过相似努力的都知道其中的痛苦。
Qwen在开源上的成功最重要的节点是它真正取代了Llama,而这不是简单的模型平替,它建立了几乎从没有过的,在一个技术的开放基座上成为领导角色,并通过诚恳而高质量的开源来获得一众追随者的状态。
在诸多开源贡献者和Qwen内部人士看来,这个成绩的获得,林俊旸和他带领的团队的努力至关重要。
但是,当今天模型的竞争里,差距变成评测榜单上几个小数点的竞争,另一方面,商业化的可能快速出现,用户渗透率提升,token调用疯涨,红包等运营带来的营收和用户数可以快速变化,与传统业务的结合压力增大时,一切就都开始冲击这一阶段的开源决策。
尤其是本来对很多厂商来说,开源就不是一个自上而下主动的选择,建立一种带有引领意义的开源与作为一种策略来追求当下核心指标增长的开源,已经明显出现了冲突。
2 Qwen is nothing without its people
在林俊旸的推文发出以后,不少人跟着发“ Qwen is nothing without its people”,这是OpenAI此前宫斗时候的句式。
据了解,此番内部的讨论,一大焦点其实就在于人才问题,即所谓能不能有“造神”的行为出现。这也是引起外界广泛讨论的重要导火索:人们更能和林俊旸共情,因为这是一个自下而上做了事情的人。而且林俊旸在与开发者社区交流互动中也体现出了他的魅力,这正是真正建立起一个生态很需要的特质。
在我们和多个模型开源贡献者的交流中,他们都形容开源和社区生态一直不是一个战略问题,而是执行问题。那么,执行的那个个人就自然会成为注意力焦点,成为IP。
OpenAI有各种研究员自己就是影响力巨大的个人IP,Anthropic 有最早给他们建立起来开发者关系的Alex Albert,他天天出现在模型发布的宣传以及和自己团队做的播客中,十分活跃,Google有Logan Kilpatrick,从OpenAI高调跳去参与改进和活跃了Gemini 的开发者社区,他们成为关注焦点没人觉得有问题。
现在我们难得有了一个林俊旸,然后还被干掉了。你说大家共情不共情。
而这里面也还有一个很大的变化,对很多中国公司尤其是体系森严的公司来说似乎都还没有接受:就是AI时代的公司们会有多个明星人物,而非过往仅仅一个公司一张面孔或者顶多一个业务线有一个公众面孔。而今天这些有活人感的非高管或者核心团队成员可能是一款开源模型,一个产品,一个技术被不停讨论和被大家喜欢的重要原因。
3 组织内长出的超级个体
林俊旸是“阿里最年轻的P10”,他还是阿里体系一路成长出来的技术leader,而这次的另一个变量和内部会议里被放在明面上讨论的点是最近新加入的来自Google的周浩。
在不少从业者看来,林俊旸是难得没有什么自带师承派别有庞大关系图谱的技术leader,甚至这次才有很多人第一次知道他是个“文科生”的履历背景,也许正是这样的不同才让Qwen做出不同的开源社区景象。
在这种非标人才真正给模型的整体目标带来巨大贡献的时候,公司如何面对他们,在重金引入外部人才后,能不能让他们很好融合,而不要注定变成洗牌,这些问题都需要新的方式来处理。
今天各个模型公司都在对外描述一个超级个体因为他们的AI技术而大规模出现的景象,但对内部长出的超级个体如何应对却依然反差明显。
4 严重的组织惯性
在整个事件透露出的处理过程里,内部沟通和矛盾不停积累,这被很多人指向阿里本身的老问题,人们突然发现大厂的惯性如此之强,甚至被形容为颠覆一切的AI似乎也没有改变任何一家公司的“传统”。
有内部人士跟我们分享,事情发展至今一个重要导火索是算法团队的分拆方式和时机。对于长期观察阿里来说会很容易闻到熟悉味道。这家公司一直通过全方位的轮岗来维持流动性。但一个习惯了通过轮岗的制度来对抗抢地盘问题的公司,如何应对一个从技术本质上需要有一定全栈建制的新模式,曾经有效的方式能不能更新,才是考验。
5 商业竞争之下,对模型的耐心
模型不是一个人做出来的,开源最终要和商业化结合,这是每个人都能念叨的道理。
可是模型在其中作为底层与直面商业化的产品与服务之间的关系前所未有的复杂。
当竞争加剧,模型是可以作为一种商业竞争工具和市值管理工具的,对于投入巨大的商业巨头,这无可厚非,但它非常考验这里面对整体资源的把握,以及有没有更长期的耐心。
在Qwen刚开始推动开源的时候,这还是一个没有受到太多关注的方向,因此间接获得了空间和耐心,最终得以从这个复杂体系里跑了出来。
而随着商业化的机会和竞争都迅速展开,模型在开源思路下的训练节奏,与从争夺产品侧用户出发设计的训练思路,有很大不同。
据Qwen的一些研究员介绍,在模型的路线上,Qwen此前一直有自己的节奏,坚持在小尺寸训练后,在大的尺寸里再去实现,这对于算力的需求是周期性的,但也注定会需要越来越多的算力。而当来自整体竞争压力下的更多产品动作开始改变训练策略,甚至在随之而来的组织变动里,技术路线的讨论和算力资源的分配也都能政治斗争化的时候,节奏显然不同了。
在这种情况下,当你开始更激进赶一个deadline,赶一个对手的阻击节点,短期目标和一个模型本身的发展路线之间的平衡会变得更复杂,这时候算力和各种资源的争夺就会变成动荡的由头。而模型训练是一个每个环节都不能出错的工作,各个模型厂商的各种历史经验几乎都指向:临时的应对会带来失望的结果。
在一整天不停的讨论中,有一个很有意思的截图,有人问千问AI,马云说过的人才流失的两大原因是什么,回答是钱没给够或者受了委屈。
现在,可能要再加一个:GPU没有分够。在商业化,开源,模型,产品等之间怎么更有耐心的分配资源,最终会决定一个AI组织的未来。
林俊旸离开Qwen给AI公司们提出的五个问题
这里面的挑战是今天所有号称自己为AI native组织的公司们都在面对的问题。
林俊旸的名字刷屏了一整天。
3月4日,作为阿里Qwen的开源负责人及模型的核心开发者,同时也是技术社区影响力巨大的中国AI模型厂研究员林俊旸突然发了一条推文,称自己正在离开Qwen。
紧接着是全网瞬间点燃的各种热议,以及技术社区的广泛声援。据一些Qwen团队的研究员称,这是积攒了许久的问题以最难看的形式爆发。
这几乎称得上一条x引发的大地震,它所暴露出来的问题,也足够复杂全面,每个参与讨论的从业者似乎都在讨论他们自己,都有切肤之痛,从开源的策略到一个组织的惯性,再到所体现出来的人心向背,这里面的挑战是今天所有号称自己为AI native组织的公司们都在面对的问题。
1 开源的策略
林俊旸对于Qwen开源这件事的象征意义有多强?在他的推文发布后,大家第一时间反应就是阿里的开源策略是否要生变。
但据接近Qwen团队的人士透露,在内部的沟通里,其实反而没有太多回应开源的话题。外界的担忧和第一时间内部反应的落差,指向更大的问题:开源作为中国多个厂商的策略,接下来如何持续。
开源在很长一段时间成为中国模型厂商竞争的手段,开源作为一种策略,本身有两个效用:
一是真正建立有影响力的社区,借此在整体资源依然不均衡的AI竞争中破局,
二是“我的开源已经逼近闭源”的叙事。这显然对竞争以及获取用户也有用,这也是当初OpenAI被DeepSeek冲击后,Altman说出它可能“站在历史错误一边”的重要原因。
但这个过程肯定是曲折的,所谓的逼近也会反复。在模型能力起伏时候能不能坚持,还是说在落后时挺彻底的开源,在一个阶段取得领先,被这个叙事自我感动后,认为开源都超过了闭源又何必开源,然后改变策略,会走向完全不同的结局。
这里就出现了巨大的落差,开源本身需要的开放,和竞争策略本身需要的封闭之间的冲突。林俊旸成为了某种开源社区追随的明星就是他身上体现出了各家模型厂都少有的开放感。
你可以想象,得有多大的对开源的信念,才能用如此多的精力去在一个组织森严的体系里,寻找可能的空间。他的很多分享都是以“在可以分享的尺度里尽可能分享给社区”为开头展开,任何一个尝试过相似努力的都知道其中的痛苦。
Qwen在开源上的成功最重要的节点是它真正取代了Llama,而这不是简单的模型平替,它建立了几乎从没有过的,在一个技术的开放基座上成为领导角色,并通过诚恳而高质量的开源来获得一众追随者的状态。
在诸多开源贡献者和Qwen内部人士看来,这个成绩的获得,林俊旸和他带领的团队的努力至关重要。
但是,当今天模型的竞争里,差距变成评测榜单上几个小数点的竞争,另一方面,商业化的可能快速出现,用户渗透率提升,token调用疯涨,红包等运营带来的营收和用户数可以快速变化,与传统业务的结合压力增大时,一切就都开始冲击这一阶段的开源决策。
尤其是本来对很多厂商来说,开源就不是一个自上而下主动的选择,建立一种带有引领意义的开源与作为一种策略来追求当下核心指标增长的开源,已经明显出现了冲突。
2 Qwen is nothing without its people
在林俊旸的推文发出以后,不少人跟着发“ Qwen is nothing without its people”,这是OpenAI此前宫斗时候的句式。
据了解,此番内部的讨论,一大焦点其实就在于人才问题,即所谓能不能有“造神”的行为出现。这也是引起外界广泛讨论的重要导火索:人们更能和林俊旸共情,因为这是一个自下而上做了事情的人。而且林俊旸在与开发者社区交流互动中也体现出了他的魅力,这正是真正建立起一个生态很需要的特质。
在我们和多个模型开源贡献者的交流中,他们都形容开源和社区生态一直不是一个战略问题,而是执行问题。那么,执行的那个个人就自然会成为注意力焦点,成为IP。
OpenAI有各种研究员自己就是影响力巨大的个人IP,Anthropic 有最早给他们建立起来开发者关系的Alex Albert,他天天出现在模型发布的宣传以及和自己团队做的播客中,十分活跃,Google有Logan Kilpatrick,从OpenAI高调跳去参与改进和活跃了Gemini 的开发者社区,他们成为关注焦点没人觉得有问题。
现在我们难得有了一个林俊旸,然后还被干掉了。你说大家共情不共情。
而这里面也还有一个很大的变化,对很多中国公司尤其是体系森严的公司来说似乎都还没有接受:就是AI时代的公司们会有多个明星人物,而非过往仅仅一个公司一张面孔或者顶多一个业务线有一个公众面孔。而今天这些有活人感的非高管或者核心团队成员可能是一款开源模型,一个产品,一个技术被不停讨论和被大家喜欢的重要原因。
3 组织内长出的超级个体
林俊旸是“阿里最年轻的P10”,他还是阿里体系一路成长出来的技术leader,而这次的另一个变量和内部会议里被放在明面上讨论的点是最近新加入的来自Google的周浩。
在不少从业者看来,林俊旸是难得没有什么自带师承派别有庞大关系图谱的技术leader,甚至这次才有很多人第一次知道他是个“文科生”的履历背景,也许正是这样的不同才让Qwen做出不同的开源社区景象。
在这种非标人才真正给模型的整体目标带来巨大贡献的时候,公司如何面对他们,在重金引入外部人才后,能不能让他们很好融合,而不要注定变成洗牌,这些问题都需要新的方式来处理。
今天各个模型公司都在对外描述一个超级个体因为他们的AI技术而大规模出现的景象,但对内部长出的超级个体如何应对却依然反差明显。
4 严重的组织惯性
在整个事件透露出的处理过程里,内部沟通和矛盾不停积累,这被很多人指向阿里本身的老问题,人们突然发现大厂的惯性如此之强,甚至被形容为颠覆一切的AI似乎也没有改变任何一家公司的“传统”。
有内部人士跟我们分享,事情发展至今一个重要导火索是算法团队的分拆方式和时机。对于长期观察阿里来说会很容易闻到熟悉味道。这家公司一直通过全方位的轮岗来维持流动性。但一个习惯了通过轮岗的制度来对抗抢地盘问题的公司,如何应对一个从技术本质上需要有一定全栈建制的新模式,曾经有效的方式能不能更新,才是考验。
5 商业竞争之下,对模型的耐心
模型不是一个人做出来的,开源最终要和商业化结合,这是每个人都能念叨的道理。
可是模型在其中作为底层与直面商业化的产品与服务之间的关系前所未有的复杂。
当竞争加剧,模型是可以作为一种商业竞争工具和市值管理工具的,对于投入巨大的商业巨头,这无可厚非,但它非常考验这里面对整体资源的把握,以及有没有更长期的耐心。
在Qwen刚开始推动开源的时候,这还是一个没有受到太多关注的方向,因此间接获得了空间和耐心,最终得以从这个复杂体系里跑了出来。
而随着商业化的机会和竞争都迅速展开,模型在开源思路下的训练节奏,与从争夺产品侧用户出发设计的训练思路,有很大不同。
据Qwen的一些研究员介绍,在模型的路线上,Qwen此前一直有自己的节奏,坚持在小尺寸训练后,在大的尺寸里再去实现,这对于算力的需求是周期性的,但也注定会需要越来越多的算力。而当来自整体竞争压力下的更多产品动作开始改变训练策略,甚至在随之而来的组织变动里,技术路线的讨论和算力资源的分配也都能政治斗争化的时候,节奏显然不同了。
在这种情况下,当你开始更激进赶一个deadline,赶一个对手的阻击节点,短期目标和一个模型本身的发展路线之间的平衡会变得更复杂,这时候算力和各种资源的争夺就会变成动荡的由头。而模型训练是一个每个环节都不能出错的工作,各个模型厂商的各种历史经验几乎都指向:临时的应对会带来失望的结果。
在一整天不停的讨论中,有一个很有意思的截图,有人问千问AI,马云说过的人才流失的两大原因是什么,回答是钱没给够或者受了委屈。
现在,可能要再加一个:GPU没有分够。在商业化,开源,模型,产品等之间怎么更有耐心的分配资源,最终会决定一个AI组织的未来。
0
第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信公众账号中搜索投中网,或用手机扫描左侧二维码,即可获得投中网每日精华内容推送。
发表评论
全部评论