LF AIData 基金会主席孟伟:大模型开源与商业化仍处模糊地带( 三 )


CSDN:中兴何时开始做开源相关贡献?你所负责的标准和开源战略工作遇到过哪些挑战?
孟伟:中兴成立于 1985 年 , 早期中兴手机在国内非常知名 。除了 Linux 以外 , 在刚起步时 , 中兴已经积极加入的开发社区贡献自己的代码 。那个时候 , 大家不会刻意强调开源这件事 , 但会积极参与进来 。
中兴标准战略委员会开源组有几十人 , 包括法务、安全、合规等 , 它不称为 OSPO , 但行使着相似的职责 。中兴认为开源是一个事实标准 , 因此我们将传统的标准和事实标准(开源)放在同一个战略体系下 。开源组需要系统地识别出公司内部具有竞争力的开源项目 , 以及希望捐赠的项目 , 制定社区化运作方案以及推进开源生态的顶层设计 。
其中确实存在一些难点 。首先 , 中兴作为一家通信设备制造商 , 通信领域的开源项目数量与质量比不上操作系统、数据库领域的 , 但仍然具备一定规模 。其次 , 中兴通讯正在拓展自身的 IT 能力 , 对数据库、操作系统和芯片设计进行大量研发 。但许多团队原来专注于网络领域 , 思维可能还停留在网络定制化软件开发等方面 , 且团队间对开源的认知差异很大 , 因此未来的一项重要工作就是在公司内部进行开源布道 , 形成一种更开放的开源文化 , 增加开发者们对开源的认识与积极性 。
大模型的开源与商业化目前仍处模糊地带
CSDN:AI 在不同领域的开源程度不同 , 框架和视觉板块开源较早 , 大模型相对而言则发展较慢 , 这背后的原因是什么?
孟伟:AI 的开源有很多方向 , AI 框架是相当重要的领域 , 国内外都有很多优秀项目 。现在的框架已经非常多 , 开发者需要很长时间才能适应新的框架 , 如果有更多能屏蔽底层框架、而不需要关注底层框架的工具就更好了 。LF AI & Data 希望有更多优秀的 AI 工具出现 , 帮助企业数字化转型快速进行 , 帮助开发者更好地运用 。通过 AI 工具实现项目版本的发布和功能实现等 。大模型的开源是随着的火爆逐渐发展起来 。近期我参加了数次业界论坛 , 在探讨是否需要开源大模型时 , 我的回答都是肯定的 。当闭源的大模型成为业界标杆之后 , 底下的竞争者会纷纷开源 , 开源大模型将成为趋势 。
CSDN:对于大模型的开源 , 你更关注哪些点?
孟伟:我比较关注开源大模型的商业化与开源协议等问题 。目前 LLaMA 发展出了羊驼家族一系列大模型 , 但商用化方面可能存在一些问题 。在出来之前 , 一些可以商用化的开源大模型 , 好用程度并不高 。大模型开源 , 其形式是否与传统代码一样?问题没这么简单 。开源一段自己写的代码 , 可以直接使用许可协议 。但开源大模型里面包含算力投入、数据资产(可能是免费的数据集和购买的) , 涉及到隐私问题、数据流通问题以及安全问题 , 大模型开源面临的问题是还没有真正的规范和统一的许可证 。
前段时间中东某国开发并发布在上的一个大模型引发了广泛争议 。这个 400 亿参数的大模型 -40B 开源之后 , 其遵循的开源许可协议在开源圈引起了轩然大波 , 该许可证大部分基于2.0 , 对商业友好 , 使用者可以修改代码来满足需要 , 并作为开源或商业产品发布 / 销售 。然而却修改了部分许可证规定:其开源大模型可以商用 , 但如果超过一定金额就需要支付相应费用 。这一动作带来很大的争议 , 具有开源乌托邦精神的人认为这破坏了开源文化 , 但我个人认为这个动作道义上不正确 , 但可以理解 , 因为企业也有营收压力 。这个现象最根本的原因是没有统一的许可协议来约定大模型开源应遵守什么样的规范?以及如何避免出现隐私问题、法律问题?这些都很敏感 , 企业一旦踩雷可能会付出昂贵的代价 。