GitHub 在版权侵权问题上推出“Copilot for Business”计划
4分钟读
更新
阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多
微软的 GitHub 现在将 Copilot 引入企业。 本周,这家基于云的 Git 存储库公司推出了一项名为“Copilot for Business”的新计划,每位用户每月收费 19 美元。
GitHub 希望通过提供 Copilot for Business 计划来扩大其对其他用户的影响。 新产品预计将增加 400,000 名 AI 工具的订阅者,该工具可根据开发人员当前在项目中的工作提供建议,帮助他们编写代码。 该工具由 OpenAI 开发的名为 Codex 的人工智能模型提供支持,该模型“在数千万个公共存储库上进行过训练。” 它与 Visual Studio、Neovim 和 JetBrains 集成开发环境相辅相成,使开发人员编写代码更加轻松快捷。
该业务计划包括单许可证 Copilot 层中提供的功能,并添加了许可证管理和组织范围的策略管理功能。 GitHub 进一步补充说,该优惠具有行业领先的隐私,“无论数据来自公共存储库、私有存储库、非 GitHub 存储库还是本地文件,都不会保留代码片段、存储或共享你的代码。”
GitHub 产品管理高级总监 Shuyin Zhao, 说 在听到“公司希望通过一种简单的方式为其团队购买 GitHub Copilot”后,推出了新优惠。 然而,要说企业会热烈欢迎这项提议几乎是不可能的,因为 Copilot 仍处于未解决的版权侵权问题之中。
@github copilot 屏蔽了“公共代码”,发出了大量我受版权保护的代码,没有署名,也没有 LGPL 许可证。例如,简单的提示“稀疏矩阵转置,cs_”会在 CSparse 中生成我的 cs_transpose。左边是我的代码,右边是 github。不行。 pic.twitter.com/sqpOThi8nf
——蒂姆·戴维斯(@DocSparse) 2022 年 10 月 16 日
几个月前,有人注意到 Copilot 生成了可疑代码。 XNUMX 月,德克萨斯 A&M 大学计算机科学教授 Tim Davis 叫出来 GitHub,因为他发现该工具在公共代码被屏蔽时生成了“大量我受版权保护的代码,没有归属,没有 LGPL 许可”。 该过滤器旨在成为一种解决方案,以防止建议代码与 GitHub 上的公共代码匹配(或接近)。 根据一个 文件 来自 GitHub,它“根据 GitHub 上的公共代码检查代码建议及其周围大约 150 个字符的代码。” 但是,该功能似乎无效,尤其是在戴维斯透露了他发现的案例之后。
GitHub 警告说,在大约 1% 的情况下,建议可能包含一些与训练集匹配的长度超过 ~150 个字符的代码片段。 此外,GitHub 表示,该工具可能会生成带有“不良模式”的代码,这可能会给用户带来风险。 在其 文件,GitHub 说明:
GitHub Copilot 根据 OpenAI 从数十亿行开源代码构建的模型提供建议。 因此,GitHub Copilot 的训练集可能包含不安全的编码模式、错误或对过时 API 或习语的引用。 当 GitHub Copilot 基于此训练数据生成建议时,这些建议也可能包含不需要的模式。
您有责任确保代码的安全性和质量。 我们建议您在使用 GitHub Copilot 生成的代码时采取与您在使用非您自己编写的任何代码时相同的预防措施。 这些预防措施包括严格测试、IP 扫描和安全漏洞跟踪。
该警告将责任直接推给了用户,如果在他们的项目的最终制作中包含被忽视的受版权保护的建议,他们就有可能面临诉讼。
XNUMX 月,程序员兼律师 Matthew Butterick 与集体诉讼公司 Joseph Saveri Law Firm 合作推出了一项 集体诉讼 针对 Microsoft、GitHub 和 OpenAI。
“作为一名长期的开源程序员,从我第一次尝试 Copilot 开始,很明显它引起了严重的法律问题,自从 Copilot 于 2021 年首次公开预览以来,许多其他人都注意到了这一点,”Butterick 说。 “因为我也是一名律师,所以我觉得有必要为开源社区挺身而出。 自从乔创办了约瑟夫萨维里律师事务所以来,我就认识他了。 他已将其打造成该国最好的集体诉讼公司之一。 我很高兴代表那些权利被 Copilot 侵犯的开源程序员与 Joe 和他的公司合作。”
尽管存在这些问题,GitHub 仍决心将其 Copilot 提供给更多用户,尤其是企业。 然而,时间将证明公司是否愿意承担风险。
用户论坛
0消息