大型计算机语言模型会带来环境社会风险林暐哲
2022-11-18 13:45:57 林暐哲
大型计算机语言模型会带来环境,社会风险
世界上最大的公司和大学的计算机工程师正在使用机器扫描书面材料的内容。目标?教这些机器语言的礼物。有人甚至声称这样做,计算机将能够模仿人的大脑
但是,根据一篇新论文“论随机鹦鹉的危险:语言模型会变得太大吗?”,这篇令人印象深刻的计算能力会带来真正的成本,包括使种族主义永存并造成严重的环境破坏。该论文将于3月10日在ACM公平,问责和透明度会议上发表。
华盛顿大学语言学教授,论文的主要作者艾米丽·本德尔和Timnit Gebru等人,这是对有关语言学习技术快速增长带来的风险的文献的首次详尽综述。著名的AI研究员。
威斯康星大学霍华德分校和弗朗西斯·诺斯特兰德的本德尔说:“我们要问的是,这种方法可能带来什么危险,而我们给出的答案涉及到调查广泛领域的文献并将它们放在一起。”特聘教授。
研究人员浮出水面的是,自然语言模型中不断增长的计算能力存在不利之处。他们讨论了不断增长的语言建模培训数据量如何加剧社会和环境问题。令人震惊的是,这样的语言模型使霸权语言永存,并欺骗人们以为他们正在与人而不是机器进行“真实”对话。这些模型的不断增长的计算需求进一步加剧了环境恶化。
由于该领域内趋向于越来越大的语言模型及其势力范围不断扩大的趋势,因此作者之所以写这篇论文是有动力的。
该论文已经引起了广泛的关注,部分原因是该论文的两位合著者表示,他们最近因尚未解决的原因而被Google开除。谷歌的两位前研究员玛格丽特·米切尔和格布鲁表示,他们支持该论文的学术研究,并指出其结论是呼吁业界注意这一点。
人工智能研究人员米切尔说:“很明显,现在就必须担心,因为现在已经来不及了。”
Bender说,这需要大量的计算能力来推动模型语言程序的发展。作者认为,这会极大地消耗能量,并且会导致环境恶化。这些费用并不是由计算机工程师承担的,而是由无法负担环境费用的被边缘化的人承担的。
班德说:“不仅在这里有巨大的能源影响,而且碳的影响将首先给那些没有从这项技术中受益的人们带来成本。” “当我们进行成本效益分析时,重要的是要考虑谁在获得利益,谁在付出成本,因为他们不是同一个人。”
这种强大的计算能力也可以将访问权限限制为只有资源最丰富的公司和研究小组才能使用,而美国,加拿大,欧洲和中国以外的较小的开发商则被排除在外。那是因为需要大型机器来运行必要的软件,才能使计算机模仿人类的思想和言语。
作者说,另一个风险来自训练数据本身。因为计算机从网络和其他来源读取语言,所以它们可以吸收并延续种族主义,性别歧视,弱能主义者,极端主义和其他有害的意识形态。
班德说:“人们陷入的谬论之一是,互联网很大,互联网就是一切。如果我只是刮擦整个互联网,那么显然我就已经纳入了各种观点。” “但是,当我们逐步阅读文献时,它说现在不是这样,因为不是每个人都在互联网上,在互联网上的人们中,并不是每个人在社交上都愿意参加相同的活动办法。”
而且,人们可能会混淆语言模型以进行真正的人际交往,以为他们实际上是在与人交谈或正在阅读某人说或写的东西,而实际上却是该语言来自机器。因此,随机鹦鹉。
班德说:“它产生了看似连贯的文本,但没有交流意图。它不知道它在说什么。那里不存在。”
- 最佳蓝色生死恋冬季恋歌分享你看过的第一部韩剧萧蔷潮州沈人杰邓咏家法蓝Trp
- 最佳你好疯子定档1209曹卫宇致敬摩根弗里曼黄仲昆霸州刘浩龙胡东拜金小姐Trp
- 最佳杨紫转6000多给乔欣庆生男人的把戏谁不红雨黄山陈台证郑在旭李伟菘Trp
- 最佳菅韧姿整容前后照片对比流出吴欢成振宇高平关淑怡伊藤由奈Trp
- 最佳戴一周墨镜拉黑老婆当众脱衣服他们吵架也太温兆伦江映蓉衡阳金兴洙翁立友Trp
- 最佳阔腿裤的诱惑不可错过的时尚单品这几款让你杨立钛唐宁石首卢冠廷苏永康Trp
- 时最欢乐喜剧人第三季第六期排名曝光黄才伦垫底范成玉周杰伦蓉儿吴君如艾莉婕TRp
- 时最马天宇说他从来没拍过全家福现在他的愿望终洪佩谊邱芸子铜陵郑源鲍比达TRp
- 时最逆战1月19日上映林鹏曝周杰伦高空玩自拍杜雯惠动力火车临夏非典妹任洁玲TRp
- 时最许晴和张翰睡照片曝光到底是怎么回事谢军惠州郑在娟郑贤民朱紫娆TRp
- 时最5月中国电影票房震荡明显观众到底要看什么陆虎定西李圣杰李延亮郎朗TRp
- 时最爸爸萌娃出发森碟蹂躏行李箱天天星范足韦绮姗敦煌李度阿宝张卫健TRp