扎克伯格将使用Facebook和Instagram上发布的图像来训练他的人工智能工具

在 Meta 第四季度业绩的财报电话会议上，马克·扎克伯格明确表示，他将使用 Facebook 和 Instagram 上发布的图像来训练他的生成式人工智能工具。

在隐晦地提到 OpenAI 的 DALL-E 和 Midjourney 的同时，扎克将其他人工智能公司的数据源与他自己的数据源进行了对比。

“当人们考虑数据时，他们通常会想到可以用来预先训练模型的语料库，”扎克伯格说。

“在 Facebook 和 Instagram 上，有数千亿个公开共享的图像和数百亿个公共视频，我们估计这些数据比 Common Crawl 数据集还要多，而且人们也在我们的服务中的评论中分享了大量的公共文本帖子。 ”

OpenAI 使用 Common Crawl 数据集来构建其广受欢迎的 AI 应用程序。从本质上讲，扎克伯格是说 Meta 不需要像 Common Crawl 或 LAION-5B（在线图像和字幕的开源索引）这样的服务，因为他已经可以访问此类海量数据。

周四，扎克伯格公布了好消息，上一季度的利润增长了两倍，今天股价上涨了 20%。

他在财报电话会议中明确表示，该公司正在大力投资人工智能和虚拟现实。

在人工智能方面，扎克伯格乐观地表示，他正在这个领域“为胜利而战”，其他参与者包括谷歌、OpenAI 和微软。

上个月，Meta宣布推出一款独立的 AI 图像生成器，以与 DALL-E 和 Midjourney 等产品竞争。

Meta 已经承认，它已经使用所谓的“公开可用”数据来训练其人工智能工具。

从本质上讲，如果您有一个公开的 Facebook 或 Instagram 个人资料并在其中发布照片，那么 Meta 很有可能会利用您的作品来训练其 AI 图像生成器工具。

一段时间以来，人工智能训练数据一直是讨论的热门话题，摄影师和艺术家对人工智能公司目前的运作方式表示不满。

Meta 全球事务总裁 Nick Clegg 承认，他预计将有“相当多的诉讼”来确定使用受版权保护的材料来训练人工智能是否受到合理使用的保护。

①本网转载并注明来源的文章(作品)，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类文章(作品)侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的文章(作品)来源，并自负版权等法律责任。
②如涉及文章(作品)内容、版权等问题，请在作品发表之日起一周内与本网联系，我们将在您联系我们之后72小时内予以删除，否则视为放弃相关权利。

扎克伯格将使用Facebook和Instagram上发布的图像来训练他的人工智能工具

相关推荐