启动重新发明的人工智能解决方案 使算法更人性化
众包自动化测试公司今天宣布推出一种新的人工智能培训解决方案,该解决方案将帮助机器学习算法更好地处理人类输入数据。
新的可伸缩的、企业化的解决方案训练机器学习算法快速学习并测试它们以检测和纠正偏差,从而确保它们正在进行适当的处理和响应。
为了做到这一点,掌声正在使用其庞大的经审查的人类测试人员社区,以便在一个最符合被测试产品和服务的现实生活条件的环境中产生最广泛的潜在培训投入。然后,这些数据通过系统反馈,并在每个可能的设备、地点和情况下进行测试,以帮助确定可能出现的问题,并实时提供可操作的用户反馈。
“用户希望AI更自然、更人性化。掌声的众包方法提供了人工智能所缺失的东西:在发布之前,大量的真实人类互动,“掌声的产品副总裁克里斯汀·西蒙尼(Kristin Simonini)说。
通过设计,鼓掌收集的数据旨在帮助避免孤立的小群体的偏见,这将是任何人口的一个很差的代表性。对于有才华的测试人员来说,这尤其是一个问题,他们的人群很容易引入偏见,因为那些训练测试产品的人很容易来自相同的背景。
因此,该公司收集的机器学习培训数据来自许多国家、年龄、性别、种族、文化、政治派别、意识形态、社会经济背景、教育水平等。这种广泛的数据样本的基础导致了一种设计方式,以更好地模拟较少偏见的输出,而不是如果数据来自较小的群体。
西蒙尼尼说:“这不仅会改善各地消费者的AI体验,社区的广度也有可能缓解偏见担忧,让AI更能代表现实世界。
目前市场上的所有类型的人工智能都遇到了一个极其相似的问题:获取足够的数据来教ML算法如何解释和响应。这一挑战阻碍了许多人工智能解决方案的生产,从旨在识别食物的营养应用程序到虚拟助手,学习不同的用户如何要求相同的东西。
鼓掌的新人工智能解决方案跨越五种不同类型的人工智能参与:语音、光学字符识别、图像识别、生物识别和聊天机器人。
对于语音,数据池使用源语言来训练语音支持的设备。对于OCR,它包含可视化地读取文档和相应的文本来构建上下文。通过图像识别,它提供了机器学习算法来检测和分类预定义的对象和位置。对于生物识别,它提供生物特征输入,如人脸和指纹。对于聊天机器人,数据源示例问题和不同的意图,以更好地理解用户需求,并以更人性化的方式作出反应。
当训练人工智能系统的团队没有考虑到大量潜在的人力投入时,它可能导致的不仅仅是糟糕的客户服务或产品。一些极其巨大的机器学习失败之所以能制造新闻,是因为他们无法正确识别面孔,比如2015年谷歌有限责任公司(Google LL C)的照片识别算法将黑人误认为“大猩猩”(该公司将大猩猩从训练库中剔除,从而纠正了这一点)。而在2016年,一种新西兰护照验证算法错误地识别了22岁的亚洲DJ理查德·李(Richard Lee)的眼睛闭上了。
虽然这些失败被广为宣传,而且潜在的问题在事后看来是显而易见的,但它们也揭示了一个深刻的文化问题,即人工智能系统是如何被训练来与不同的人类群体互动的。机器学习与人互动的扩散和实施是一个以人为本的问题,需要考虑到这一点的解决办法。
利用其众包的人类数据库,鼓掌希望有助于朝着建立更好的人工智能培训系统迈出第一步,该系统将减少未来出现这些错误的可能性,并可能在偏见成为人类问题之前检测和警告偏见。