人工智能研究人员仅通过微笑的方式就可以预测对象是男性还是女性。这提出了一些有趣的问题,但可能不是您正在考虑的问题。
男性和女性会以不同的方式微笑吗?
英国布拉德福德大学工程与信息学系视觉计算中心的Hassan Ugail教授和Ahmad Al-dahoud教授决定,找出答案的最佳方法是使用机器学习对微笑进行分类。这个问题比您想象的要困难得多,因为他们决定使用动态功能。这不仅仅是在固定的时间点比较微笑-最大的微笑-他们决定包括取决于微笑如何发展的功能:
“我们的动态框架通过使用整个面部的一系列空间特征,嘴巴的区域,面部主要部分周围的几何流动以及基于人体动态几何的一组固有特征来测量笑容期间面部的变化。脸这使我们能够提取210个不同的动态微笑参数,这些参数构成了机器学习的重要特征。”
这也作为AI系统实现:
这些功能都是手工构建的,并建立了一套可用于后续工作的功能。使用的数据集是的,是的,有微笑的人,包括109名受试者-69位女性和40位男性。
比较了与微笑区域有关的数据特征的初步检查,仅发现没有明显的男性/女性差异。但是,考虑到时间,似乎确实有所不同:
“因此,它的确证实了与男性相比,女性的笑容随着时间的流逝会更多。”
仅使用此摘要功能,分类精度为60%,仅略高于机会(50%)。
继续前进的团队尝试了其他机器学习技术。SVM仅达到69%,但k-NN算法达到86%,这使研究人员得出结论,男性和女性的微笑确实有所不同。结果已在2018年4月的《视觉计算》(Visual Computing)中进行了报道,并且该文章也可以通过开放获取获得。
这个结论是否正确-在一个相对较小的样本中,有86%寻求一种可行的方法,似乎并不令人印象深刻。实际上,这似乎与常规的统计推理背道而驰,传统的统计推理表明您绝不应该选择分析来仅获得所需的结果。
曾几何时,性别差异问题将被视为统计问题。收集一些数据并对差异的显着性进行统计检验。但是,如果像微笑一样,您想要测试的东西很复杂怎么办?为什么不简单地构造一条规则,看看它是否可以成功地区分两组。如果可以,则确实存在差异。如果它只做得很好,那么根据您使用的数据就没有。在“大数据”,“数据科学”的兴起以及某种程度上在人工智能和机器学习中的兴起似乎已经忘记了这种精确的方法。
这种推理是关于结果重要性的问题,即仅凭偶然获得结果的概率是多少。我们正在研究的问题是样本量。是109名受试者的样本,其分类率为86%足够显着,即排除了这仅仅是偶然发生的可能性。
有趣的是,您可以相当轻松地计算k-NN分类器结果的重要性。
想象一下,样本来自一个分布,并且男性/女性标签刚刚被随机分配-也就是说,男性和女性之间没有区别。
那么,仅凭偶然机会获得正确分类的概率是多少?
如果您对n进行采样,然后从相同分布中对新点进行分类,那么该点落在具有相同标签的点旁边的概率是多少?假设两组大小相等,将标签随机应用于这些点时,答案显然为0.5。当两个标签不相等时,则概率为(1-p)^ 2 + p ^ 2,这使其可能性更高。
现在,如果您对m点重复分类,则仅通过偶然获得正确的c点分类的可能性就由累积的二项式分布给出(与抛硬币一次和获得c头相同)。
即使您使用交叉验证方法,该参数也可以使用,因为这不会修改仅凭偶然达成一致的标签相关参数(请注意,在k-NN中,无论如何,您始终忽略要分类的点。
因此,举例来说,假设我们有一个基于N样本的分类器,分类结果为86%,仅凭偶然机会获得此分类的概率是多少:
N s100.0107200.0002300.0000042
您会看到,对于大于10的样本量,您将获得明显的结果。
有趣的是,第一个尝试的分类方法仅获得60%的正确率,仅凭偶然获得此方法的可能性就为0.186,正如研究人员所建议的那样,这并不重要。
对于样本大小为109的微笑数据,仅通过偶然的k-NN分类获得86%正确率的可能性就很小了,因此结果是显着的,甚至允许对同一数据尝试多种分类方法。
因此,男性和女性的微笑有所不同,统计数据支持机器学习。
有趣的是,对神经网络进行端到端训练将如何完成同一任务。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。