|
Post by account_disabled on Feb 1, 2024 7:59:13 GMT
垃圾进,垃圾出”是计算的基本原则之一。GIGO 是在打孔卡用于编程时创造的,但事实上它不受技术进步的影响。不良数据会产生不良结果。一直都是并且永远都会。 改变的是结果的影响,因为现在有多少决策是由人工智能做出的。在营销中,这些算法可以决定一切,从受众细分到最有效的创意,再到最佳渠道。但无论您的数据来源多么充足、多么干净,它都无法解释大量数据丢失的人 女性就是这样的群体之一。 Bhuva Shakti 是一位华尔街资深人士,现在担任专门从事数字和人工智能道德转型的顾问。 经济活动缺失 “当一名女性想要[钱]开一家商店或类似的东西时,”她说,“她们会通过金融机构。他们的数据被输入到系统中,这些数据有很多偏见,或者不完整,或者内置了历史性的系统决策。” 偏见可能是由于某个人群被剥夺了参与某些经济活动的机会而造成的。几个世纪以来,在世界许多地方,妇女无法获得银行贷款。 因此,他们可能会从非官方来源借款,这些来源不 WhatsApp 号码数据 会创建以后可用于证明信誉的记录。 深入挖掘:从数字来看:多元化和包容性是好生意 在美国,至少从 1936 年起,银行以及联邦、州和地方政府就给黑人获得抵押贷款带来了困难。拥有住房是家庭积累财富的主要方式之一。这就是为什么截至 2015 年,大波士顿地区白人家庭的净资产中位数接近 25 万美元,而黑人家庭的净资产中位数为 8 美元。这不是一个错字。 无论原因是什么,偏差都会导致数据不准确。这些数据用于做出决策,并且当它成为进一步决策的基础时,其影响就会被放大。 “当你编写人工智能算法时,它不会进行一次性处理,”沙克蒂说。“它将继续以某种模式、循环地学习。这意味着您过去的决策和数据存在偏见。如果人工智能今天根据明天的决定做出决定,它就会重复这个决定,因为它没有学到任何新的东西来纠正方向。” 课程更正不存在的数据 对于不好的数据,你当然可以使用好的数据来纠正。 当遇到数据不存在的情况时,你会怎么做? “你将如何弥补这些差距?” 沙克蒂问道。“我们最近一直在使用的一个概念是合成数据,它也被许多华尔街银行使用。” 合成数据是人工生成的,而不是由现实世界的事件产生的。通常由算法或模拟创建。它可用于测试数学模型和训练机器学习模型。 “这些数据将通过为您的个人资料定制的正确数据来填补空白,从而帮助您在个人资料上做出更好的决策,”Shakti 说。“举个例子,你不是房主,但包括住房所有权在内的某些信贷决策被用作确定你获得多少信贷的标准。通过综合数据,房屋所有权可以被您个人资料中的其他内容所取代。也许是你的社会地位、薪水或其他类似的东西。” 合成数据面临的一项挑战是有时它看起来像真实数据。人们可能会有意或无意地通过在多个配置文件中使用它来滥用它。沙克蒂说,这就是为什么合成数据只是解决方案的一部分。 测试你的模型 另一部分是技术方面的。所有模型都需要反复进行压力测试。
|
|