数据库

人工智能的开源起源及其对当下的影响
作者 卿云 编译 2025年05月20日 09:59

开源技术在过去30年里一直是推动科技革新的最大力量之一。通过分摊研发成本、复用通用代码块以及加速专有应用程序开发,开源技术催生了一场至今仍在塑造我们数字生态系统的科技繁荣。

我们现代的网络服务器、操作系统和日常软件都构建在价值数万亿美元的开源基础设施之上。Linux内核、维基百科、火狐浏览器和GitHub只是其无数分支中的一小部分。它是现代科技繁荣背后未被充分认可的基石。尽管取得了成功,但开源的发展历程始终伴随着与微软等大型软件公司的持续博弈。

开源的影响力从一开始就遭到抵制,直到21世纪初,这场运动和更广泛的社区才在科技界获得了稳固地位。如今,正当人工智能有望成为开源复兴的新瑰宝时,其未来正受到与开源历史相同因素的影响,但其结局可能有所不同。

转变:从协作到竞争

你可能听说过人工智能开源运动正处于十字路口,有一段时间确实如此。在2022年ChatGPT发布后,OpenAI曾一度考虑采用半开源半盈利的混合模式,但自从其决定完全转向盈利模式后,大门便彻底关闭。尽管开源人工智能已取得了令人瞩目的进展,但人们可能合理地认为我们会加倍投入这一模式,然而现实并非如此简单。过去,合作有助于人工智能研究人员和爱好者推动该领域发展并分享知识。

如今,哪怕是最微小的进步都可能带来数十亿美元的潜在利润和知识产权价值。人工智能模型现在还需要海量数据进行训练,其中许多数据涉及日益私密和敏感的信息。这是人工智能巨头们不愿放弃的。这场曾经建立在合作、知识共享和 benevolent ideals 之上的运动,如今已演变成一场军备竞赛。

构建你自己的人工智能战略

因此,差异化来自于能够训练这些开源模型以满足组织的需求。借助高质量数据以及如何最 佳利用数据的战略知识,企业可以创建自己的个性化人工智能工具包。你无需与OpenAI的计算能力或其数十亿美元的资金相匹敌,只需合理利用你拥有而它们没有的一种资源——你的数据。

企业常常将数据视为被动资产。在人工智能爆发的背景下,人们过度关注工具和模型本身,而忽视了最初为它们提供动力的东西。如今,数据已成为核心。借助精心策划、灵活的数据集,企业可以实时为自身需求创建定制的人工智能工具。在生成有价值的见解、简化工作流程和自动化关键流程方面,这可能会带来决定性的影响,尤其是在竞争对手难以跟上的情况下。

开源的历史根源和持久影响

开源运动的故事与编程、编码和计算机科学的更广泛历史密不可分。随着个人电脑首次广泛普及,一群志同道合的爱好者和专家聚集在一起解决问题、推动行业发展并汇集他们的集体知识。这成为了一场极具繁荣和生产力的运动,其社区至今仍活跃。其成果催生了我们仍在使用的开源工具,如MySQL、Linux等无数工具。根据哈佛商学院最近的一项研究,开源基础设施的经济价值超过8万亿美元。该研究估计,没有开源技术,平均软件购买成本将是现在的四倍。

开源在人工智能早期发展中的作用

开源运动在人工智能的发展中也起到了关键作用。就像在学术界一样,人工智能的挑战和复杂性远非单个人或团队所能独自应对。通过将项目民主化,开源方法使人们能够分享研究成果并了解哪些方法有效。很快,随着计算能力和大数据的进步,研究进展加速。随着技术的飞跃,人工智能突然从一个思想实验变成了真正可行的现实。

2015年OpenAI进入公众视野时,这场博弈达到了高潮。它宣称要“以最可能让全人类受益的方式推动数字智能发展”。然而,这仍处于悄然孵化阶段,随着研发推进,对更多数据、算力和芯片的需求与日俱增,非盈利模式的局限性日益凸显。尽管开源平台曾是其发展的核心,但此时它已远远超越了这一狭隘范畴。

在这个新时代,企业必须以不同的视角思考,甚至需要全面反思希望数据发挥何种作用。数据是偶尔有用的资源?还是公司最宝贵的资产,构成变革性AI战略的组合拳?若选择后者,就需要打造数据团队:配备数据架构师、数据工程师、数据科学家和数据分析师,并为他们提供所需的一切工具。

长期以来,这些专业人才在IT生态系统中未被充分重视,常被视为数据管理员或存储专家,而非真正的战略家。随着AI时代的到来,数据领域已成为“超级碗”级别的战场,他们的职责(和预算)必须相应提升。数据科学家应参与重大决策,数据架构师应拥有构建内部新系统的自由,在各个层级,数据团队都应深度参与决策过程。唯有如此,才能将企业的AI战略从“标准实践”提升至“行业标杆”。

封闭的未来

预测AI的未来并非易事,但开源似乎很难再占据一席之地。正如当年的大型软件公司一样,如今的AI巨头已将其他参与者远远甩在身后,且差距还在不断扩大。但这一次,数据集、算法和训练方法论的发展速度极快,已近乎成为绝对的商业机密,凝聚了多年的洞见与研究成果。尽管开源AI社区热情高涨,但这些资源的价值太过巨大,很难从私人手中剥离。如果你曾认为可以通过开源协作的力量打造出与之媲美的AI工具,那么这种机会已不复存在。幸运的是,对于日常业务而言,实际的AI模型本身才是最有价值的工具,而这些模型可以在不泄露专有核心技术的前提下共享,因此企业仍有机会获取它们。

结论

无论AI巨头发展得多么庞大,其模型多么先进,它们永远无法像你一样了解你的公司。过去几年间,世界已发生巨大变化:优质数据如今已成为企业最具价值的资产之一,企业理应充分利用这一资产。拥有合适的团队和正确的策略,你就能构建出金钱也买不到的AI战略。

作者:Chris Stephenson与Dhaval Jadav。 Chris Stephenson是alliant公司智能自动化、人工智能与数字服务业务的董事总经理。而Dhaval Jadav是alliant公司的联合创始人兼首席执行官。

打开APP阅读全文
{{data.thematic.text}}

相关文章

加载中...

分享到

请使用浏览器的分享功能
分享到微信等