数学思想可能会大大减少训练人工智能系统所需的数据集大小

马毓盛
导读 来自铁炉大学的一对统计学家提出了一个数学过程概念,这可能允许在没有大数据集的情况下教学人工智能系统。来自Ilisucholutsky和马提亚施大

来自铁炉大学的一对统计学家提出了一个数学过程概念,这可能允许在没有大数据集的情况下教学人工智能系统。来自Ilisucholutsky和马提亚施大学的一对统计学家提出了一个数学过程概念,这可能允许在没有大型数据集的情况下教授人工智能系统。Ilisucholutsky和Matthias Schonlau写了一篇论文描述他们的想法,并在arXiv印前服务器上发表。

近年来,随着深度学习网络的发展,人工智能(AI)的应用已经成为许多研究的主题,广泛领域的研究人员已经开始寻找其用途,包括创建Deepfake视频、棋盘游戏应用和医疗诊断。

深度学习网络需要庞大的数据集,以便检测揭示如何执行给定任务的模式,例如从人群中挑选特定的面孔。在这项新工作中,研究人员想知道是否有可能减少数据集的大小。他们指出,孩子们只需要看几张动物的图片就能认出其他的例子。作为统计学家,他们想知道是否有利用数学解决问题的方法。

研究人员基于麻省理工学院一个团队最近的工作。他们发现,从一个名为MNIST的数据集中提取描述手写数字的最相关信息,并将它们打包在一起,大大减少了AI系统学习识别新数据集中的字母所需的字符数量。这对加拿大人指出,系统可以用更少的数据进行学习,因为它已经以一种新的方式接受了识别数字的训练:他们训练它识别目标是一个多少有些搜索的数字8(30%)等。和其他数字。他们称这些提示为软标签。

然后,通过将这种想法应用到一种叫做K近邻(kNN)的机器学习中,让他们将自己的想法变成图形方法。使用这种方法,他们可以将软标签应用于描述图表上XY坐标的数据集。这样一来,AI系统就很容易被训练,不需要大量的数据集就可以把点放在图上画的直线的右边。研究人员将他们的方法描述为“少于一项研究”(LO-shot),并表示有可能将其扩展到其他领域,尽管他们承认仍有重大障碍需要克服。该系统仍然需要一个大的数据集来开始筛选过程。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!