(资料图)
站长之家(ChinaZ.com)4月26日 消息:img2dataset是一款自动在互联网上搜索图像数据并用训练于人工智能图像生成器的免费工具,不过这款工具引发了网站所有者的担忧。
网站所有者认为这款工具将擅自获取他们的图像和数据,而不是经过许可,希望img2dataset停止抓取行为的做法。对此,这款工具的创建者罗曼·博蒙特(Romain Beaumont)在其GitHub表示,他们(网站拥有者)正在与人工智能不可避免的崛起作斗争,这是“可悲的”。“令人难过的是,你们中的一些人不了解人工智能和开放人工智能的潜力,因此决定与之斗争。”“在未来的几年里,你将有很多机会从人工智能中受益。我希望你尽早看到这一点。作为创作者,你有更多的机会从中受益。”
Img2dataset是博蒙特在GitHub上共享的免费工具,允许用户自动下载和调整URL列表,从而获得图像数据集,这种数据集训练图像生成人工智能模型,如OpenAI的DALL-E,开源的Stable Diffusion和谷歌的Imagen。
博蒙特还是LAION-5B的开源贡献者,LAION-5B是世界上最大的图像数据集之一,包含超过50亿张图像,供给Imagen和Stable Diffusion使用。
Img2dataset会尝试从任何网站抓取图像,除非网站所有者添加https头,如“X-Robots-Tag: noai”和“X-Robots-Tag: noindex”。这意味着网站所有者可以选择”阻止“img2dataset,不过他们中的许多人可能甚至不知道img2dataset的存在。
博蒙特为img2dataset辩护,将该工具与Google索引网站的方式进行比较,称谷歌索引方式对任何想搜索互联网的人都有好处。
对此有专家认为,网站所有者是直接受益于搜索引擎,因为它们为网站带来了有用的流量。谷歌的机器人是有原则的,不会攻击网站,大多数机器人都尊重robots.txt指令。而Img2dataset则没有,该工具似乎是故意设忽视网站所有者的指令。坦率地说,它并没有给网站所有者带来任何直接好处。
毫无疑问,Img2dataset这款AI工具引起了网站所有者的担忧,他们担心他们的敏感数据和隐私正在被侵犯,如果AI技术的发展不受控制,很容易操纵大量的数据。
img2dataset项目网址:https://github.com/rom1504/img2dataset
(举报)
哈啰出行投资成立装饰工程公司 注册资本200万元
企查查APP显示,3月18日,上海钧住装饰工程有限公司成立,法定代表...中老铁路的背后 “税务专车”一路同行
2021年12月3日中老铁路正式开通运营,仅需...云南永善佛滩顺河梯级电站全面推进建设
日前,云南省永善县顺河村举行了佛滩顺河...人社部发布信用管理师国家职业技能标准
近日,人力资源和社会保障部对外发布了《...中国生态环境保护实现“十四五”起步之年良好开局
中国生态环境部7日在北京召开2022年全国...观察:中国首条民营控股高铁开通之“时”与“势”
杭台高铁首趟列车即将发车。张煜欢摄1月8...中国黄金消费市场渐回暖 “古法金”饰品获年轻消费者青睐
2022世界珠宝发展大会正在海口举行。8日在...宁吉喆:2021年中国GDP将连续第二年超百万亿元
中国国家发改委副主任兼中国国家统计局...北交所董事长徐明:北交所成立以来股票平均上涨98.9%
北京证券交易所董事长徐明8日表示,北交所...2021年北向资金流入超4300亿元 外资热情拥抱中国资产
尽管面临疫情反复等多重不利因素,外资在2...Copyright © 2015-2022 现在建筑工程网版权所有 备案号:粤ICP备18023326号-5 联系邮箱:855 729 8@qq.com