亚马逊网络服务(AWS)调查人AI搜索初创公司Perplexity AI

亚马逊网络服务(AWS)正在调查人工智能搜索初创公司Perplexity AI。该公司被指控违反AWS服务条款,抓取了被禁止访问的网站内容,包括知名新闻网站的内容。
亚马逊网络服务(AWS)调查人AI搜索初创公司Perplexity AI

据《连线》杂志报道,亚马逊网络服务(AWS)正在调查人工智能搜索初创公司Perplexity AI。该公司被指控违反AWS服务条款,抓取了被禁止访问的网站内容,包括知名新闻网站的内容。

Perplexity AI是一家获得杰夫·贝佐斯家族基金和Nvidia支持的初创公司,估值最近达到了30亿美元。据称,Perplexity依赖抓取通过Robots排除协议禁止访问的网站内容。这一协议用于指示哪些页面不应被自动机器人和爬虫访问,尽管它不具法律约束力,但大多数公司都会遵守。

AWS发言人萨曼莎·马约瓦 (Samantha Mayowa) 表示,AWS的服务条款禁止客户进行任何非法活动,客户有责任遵守这些条款和所有适用法律。客户在爬取网站时必须遵守robots.txt标准。

调查显示,Perplexity使用未公开的IP地址访问一台服务器,该服务器在过去三个月内多次访问康泰纳仕旗下的资产,显然是为了抓取被禁止的内容。《卫报》、《福布斯》和《纽约时报》的发言人也报告了类似的情况。

Perplexity首席执行官Aravind Srinivas解释说,抓取行为是由一家第三方网络抓取和索引服务公司进行的,但他拒绝透露该公司的名称。Perplexity发言人Sara Platnick表示,公司已回应亚马逊的询问,并称其PerplexityBot尊重robots.txt协议,但在用户输入特定URL时可能会忽略该协议。

数字内容行业贸易协会Digital Content Next的首席执行官Jason Kint认为,如果这些指控属实,Perplexity就违反了防止潜在版权侵权的多项原则。他强调,AI公司不应未经许可获取和使用出版商的内容。

此外,Perplexity在最近几周因涉嫌抄袭内容而备受关注。比如,《福布斯》指出,Perplexity发布的某些内容与其调查报道相似,但未引用来源或获得许可。而美联社发现,Perplexity的一款产品编造了真实人物的虚假语录。

Srinivas在接受采访时强调,Perplexity从未抄袭任何内容,并且其引擎不会对其他人的内容进行训练。然而,《福布斯》的批评促使公司更加突出地展示消息来源。

这一事件引发了对AI公司数据获取方式的广泛讨论。业界期待AWS调查结果的公布,以及可能对Perplexity采取的进一步行动。



<< 上一篇

sorry,您目前还未开通此功能哦~
想要获取更多权限,您可以

续费升级