数据|MIT最新研究:合成数据可以媲美甚至优于真实数据训练结果

3月15日 , 美国麻省理工学院(MIT)官网公布 , 为了规避数据集带来的一些问题 , MIT的研究人员开发了一种不使用数据集训练机器学习模型的方法 。
该方法使用一种特殊类型的机器学习模型来生成极其逼真的合成数据 , 这些数据可以训练另一个模型下游视觉任务 。
【数据|MIT最新研究:合成数据可以媲美甚至优于真实数据训练结果】研究结果表明 , 仅使用这些合成数据训练的学习模型与从真实数据中学习的视觉表示可相媲美甚至优于后者 。
MIT称 , 这种特殊的机器学习模型被称为生成模型 , 与数据集相比 , 存储或共享所需的内存要少得多 。 使用合成数据也有可能回避一些关于隐私和使用权的担忧 , 还可以编辑生成模型以删除某些属性 , 例如种族或性别 , 这可以解决传统数据集中存在的一些偏见 。 (澎湃新闻采访人员 邵文)

    推荐阅读