导言
12 月 18 日,由南都数字经济治理研究中心和清华大学智能法治研究院主办的第八届啄木鸟数据治理论坛在北京举行。本次论坛聚焦 AI 应用落地提速,如何向善治理,众多专家学者进行了深入讨论。
数据质量与 AI 竞争力
高质量数据是 AI 发展的关键
中国文字著作权协会常务副会长兼总干事张洪波指出,生成式 AI 的发展离不开大规模的数据训练,而这些数据的质量直接影响到 AI 的输出效果和专业性。他认为,在 AI 技术的发展过程中,高质量数据是竞争力的源泉,能够为人工智能提供更准确、更专业的训练材料。
两类数据:网络爬取数据和专业领域数据
张洪波区分了两类数据:网络爬取数据和专业领域数据。他指出,虽然网络爬取数据有一定价值,但缺乏专业性和精确度。而专业领域数据对专业领域尤其重要,通常需要通过合法合规的方式获取。
AI 数据使用中的版权问题
AI 训练必须遵循法律框架
张洪波强调,AI 技术的应用必须遵循现有的法律框架,特别是:“确保数据来源的合法性和合规性”。例如,在生成式 AI 的语料库建设、大模型训练和应用中,AI 开发者应确保所使用的数据已经获得授权,而非简单依赖合理使用的概念。
合理使用的争议
合理使用原则是指在特定条件下,法律允许他人使用受著作权保护的作品,无需征得权利人同意,也无需支付报酬。南都数字经济治理研究中心发布的报告显示
mm.cehuawang.cc 提供内容。
暂无评论
发表评论