作者 |宋婉心
编辑|郑怀舟
封面来源|视觉中国
中国拥有超过700万程序员,过去几十年间,这个庞大群体的编程工作几乎完全建立在海外提供的编程工具及底座之上。
但这一情况在过去一年发生了改变。据CSDN的数据,现在64.3%的AI编程工具为国产化,国产AI编程工具使用占比达到57.2%。
得益于国内大模型厂商的军备竞赛,如今阿里云旗下的AI编程工具“通义灵码”的使用占比,仅次于美国头部公司GitHub,其他更多国产工具产品也跻身占比前列。
要知道的是,在去年年初,编程工具这一市场在国内仍是空白。国内大模型混战的过程中,编程AI化也成为重要的竞争方向之一。
供给侧和需求侧的增长是同步的。CSDN董事长蒋涛表示,CSDN 的用户在过去一年增长了700万,关注开源 AI 的开发者占比已达到47%,AI 开发者的快速增长已经成为显著的趋势。
“全球的基础开源模型和领域开源模型已经超过1000个,开源模型在一年内的下载量更是达到了3.5亿次。这是一个十倍速的时代。”
但对于程序员而言,只有“生成代码”的大模型远远不够。软件编程是一条复杂程度足够媲美汽车供应链的系统,但其在国内的工业化程度却远不及汽车产业链。
继去年CSDN联合华为云CodeArts发布了开源社区GitCode后,今年9月21日,双方又合作发布了GitCode AI模型社区。
“GitCode AI模型社区对标Huggingface。现在开发人员核心需要两个底座,一个是代码的底座,第二个是数据和模型的底座。”
蒋涛在36氪的采访中表示,大模型生成代码是一个能力,如何把这个能力用到它的流程和代码工具里面去,这是CSDN现在要做的。
按照信息技术发展的四个阶段,第一代PC生态、第二代互联网生态和第三代操作系统和芯片,前三代中国和全球都保持着开放与互联互通。
但如今地缘政治的影响下,在第四代大模型和手机智能体应用生态,国内市场需要建立自主且完整的开发者生产力工具体系。
蒋涛认为,第四代生态是中国开源的重大发展机遇。
以下为36氪与CSDN董事长蒋涛对谈精编:
36氪:您可以先简单介绍一下这次发布的社区产品的情况。
蒋涛:这次发布的AI模型社区产品实际上是对标Huggingface的大模型社区。现在开发人员核心需要两个底座,一个是代码的底座,第二个是数据和模型的底座。
之前数据和模型的底座就用Huggingface比较多,Huggingface现在不能用了,所以我们需要构造一个相当于全类型的底座,它本身技术逻辑是一样的。
软件要有新形态,现在已经看到一些苗头和和维度了。比如手机的去APP化,现在是一个过渡阶段。
比如这次荣耀展示的跨APP能力,比如说你现在订了很多包月的业务,但是你也不知道有哪些,有时候忘掉。你对着荣耀手机说“把我包月的业务都找出来”,它能理解你这句话,手机操作系统就可以控制你的APP,模拟用户把所有都找出来再做个列表。
所以APP就变成只提供能力,不提供界面了。
这是在用户侧,然后在开发侧、工具侧,现在也在发生变化。现在程序员组装模块化的代码还需要一套工具平台,因为组装这个过程也是个数据流程,这就导致我们要有自己的底座和工具,所以现在我们现在和华为云做了这个模型和数据的底座。
之后我们还要发布一个自主的IDE工具。整体上,我们希望做三件事,也是开源的核心问题:可持续的开源底座和根生态,可信赖的开源库,可智能化的软件研发流程工具。
36氪:一年前国内AI编程工具还是空白,如今国内厂商的大模型基本都提供AI编程工具能力,GitCode及其AI模型社区和这些编程工具的生产关系是怎样的?彼此有竞争关系吗?
蒋涛:不算竞争。大模型去生成代码是一个能力,可以认为所有的大模型都有这个能力,但是怎么把这个能力用到它的流程和代码工具里面去,让它的易用性做得更好,这个是我们现在要做到的。
你要用到代码工具里面去,你所有这些东西最后是他如果是你就用大模型生成代码再拷贝过来再去编译,实际上效率是比较低的。
但是我们现在把它一站式集成,而且你写的代码马上可以运行,你写完代码以后你的program马上能出来,然后你调用大模型背后 GPU,我们也可以按调度能力给你变成一键可调用,这些都让它变得更加的方便。
36氪:国内出现的这一批AI编程工具,跟美国市场上的产品比有什么不同?
蒋涛:Llama3公布出来以后,我觉得中美本质差距不是太大,关键是在于下一代的差距会是怎么样的。
现在讲逻辑链,然后就出来了ChatGPT o1,所以o1是一条线,另外一条线是不用Transfomer做了,用新的模型来做,类似于李飞飞那个空间模型。还有一个就是准备在上面加一层,把你的任务进行收敛。
所以现在我们跟对方的差距是在这里,不在于公布出来的能力,差距是不知道对方还储备了多少。目前看起来,后续差距有可能是比我们想象的要大的,因为马斯克储备了10万张芯片,就说明一定是有对应的需求的。
但国内的这些大模型厂商,可能2万至3万张,大概是这么一个水平。
36氪:美国的AI编程工具市场比较分散,一大批创业公司,您怎么推断中国这个市场的未来竞争形态?
蒋涛:国内已经相对集中了。国内的情况比较特殊,因为国内没有这个市场,上一波做SAAS的人大部分遭遇了失败,所以现在大家就很谨慎。
我们现在也就是想为大家创造这么一个环境,就是说我们也得做供应链,而且我们其实做的是一个基础供应链,中间环节还有很多点可以被提升和改进,这些点大家都一定能收到钱才行。
我们现在需要建立的是商业化路径,做开发工具要能获得收入。现在比较容易的一个路径,是在国外的基础上先做二创,先做插件做服务,然后国外也能挣点钱,国内寻找下一个机会。
中国一大堆上市的软件公司不挣钱都是这个原因,因为没有产品能力,只有集成能力,所以就赚不到软件最好赚的钱,也就是复制的钱。
36氪:GitCode的商业化路径是怎样规划的?
蒋涛:商业化现在实际上是清楚的,只是要把路径做好。
第一,如果你能帮助他提高效率,开发人员是愿意为工具付费的,其实最愿意付费的是企业老板,因为老板买的开发人员就为了买他的工作效率,但是现在这个共识或者说常识没有被大家接受,那就要证明这一点。
这是第一个,我们首先要把 AI编程切进去,切进去以后大家发现每个环节实际上都还有可提升的空间。那么,一种就是你自己找别人的开源软件拼装进来用,一种是你去买一个人提供服务的能力,比你自己拼装效率要更高。
之后我们在这之上再构建一个集中需求的市场,因为我们可以发现用户的一些需求,我们就可以把这个需求变成一个服务,让开发人员来做,这是我们下一步正在做的一件事,但要到明年来看到底做的怎么样。
这个需求提出来了,它如果是一个可以标准化调用、可产品化、可被复制的一个需求,我们就鼓励开发人员去做这个事,然后我们就可以变成它的分销商。
就是未来所谓的“程序员up主”的概念。
36氪:关于这一点,您说会诞生大量的独立开发者,像up主一样,这是供给端,您如何确认市场有相应的大量需求去消耗这些供给?
蒋涛:需求当然也还需要被激活。因为有的需求可能没人做,但是大多数人不知道需求在哪,因为没有人去收集它。我们现在收集的是开发者的工具需求,未来可能还有应用类的需求,应用类的需求就反映出来(C端的需求情况),但是要有一个双向双轮滚动的过程。
我们还有一个sponsor,叫Micro-SaaS工会。现在不是创业难吗?但是大公司也还在做人员优化,出来的这批人就觉得做海外市场好了,海外找到需求点,如果能卖出去的话,很多独立开发者也能挣很多钱,美国本身有这个软件付费市场,所以大家先在那里练能力。
而国内还需要一个过程,这个过程在于,软件的创造成本真的要降下来。我们的工具链甚至包括国外的工具链,大家还没有用得那么顺畅,如果它能降下来,需求就有可能被满足。
但是现在的需求是什么?现在都是企业级需求,企业级需求的复杂度和交付标准要求比较高,还没有到散户要求,所以这是一个双向的过程。
这是为什么我说我们跟手机厂商未来有机会可以做联合,比如Siri上可能就有大量的需求,肯定一堆人对着苹果瞎喊一通,但没有人把它提炼出来。
这就是一个要靠程序员自己去发掘的点,但是原来付费通道又没有转起来,所以可能程序员做了几十万个应用,用户也不去调用。
所以后面就是要看,“需求的多元化”和“供给的低价化”,两个之间要找到一个碰撞点。
我们最近刚招了一个小伙子进来,他自己做IDE,他原来是做游戏引擎的一个核心工程师,后来自己做出来创业,他自己做了一个IDE,是准备帮助Python的开发者去做应用。
学Python的人是最多的,但Python有个巨大的问题,他写不出一个独立的应用程序出来,这个流程很复杂,因为国外没这个需求,国外专业程序员不用Python,他只是在需要调用一些模型数据时去调用,
国内前一阵人工智能教会了一批人用Python,但是他们没法做应用,(需求)全都撒在那儿,语法会了,做不出来。他就看到了这个需求,就做了一个Python的IDE。
然后做完这个东西,工具写出来了,但也没人用,或者大家还不太会用,他就想做个样板程序。写什么样板程序能让大家感兴趣?他就到闲鱼和淘宝上去看。
所以这需要一个过程,
36氪:这就相当于GitCode AI模型社区的角色是吧?把散户需求聚集起来,然后连接开发者跟需求。
蒋涛:对。淘宝闲鱼没有程序员,但很多人在那里发需求。而且做过的需求要再做,成本就低,因为我的程序90%是可以复用的。
*免责声明:
本文内容仅代表作者看法 。
市场有风险,投资需谨慎。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。我们无意为交易各方提供承销服务或任何需持有特定资质或牌照方可从事的服务。
点击图片即可阅读