数据|MIT最新研究:合成数据可以媲美甚至优于真实数据训练结果
3月15日 , 美国麻省理工学院(MIT)官网公布 , 为了规避数据集带来的一些问题 , MIT的研究人员开发了一种不使用数据集训练机器学习模型的方法 。
该方法使用一种特殊类型的机器学习模型来生成极其逼真的合成数据 , 这些数据可以训练另一个模型下游视觉任务 。
【数据|MIT最新研究:合成数据可以媲美甚至优于真实数据训练结果】研究结果表明 , 仅使用这些合成数据训练的学习模型与从真实数据中学习的视觉表示可相媲美甚至优于后者 。
MIT称 , 这种特殊的机器学习模型被称为生成模型 , 与数据集相比 , 存储或共享所需的内存要少得多 。 使用合成数据也有可能回避一些关于隐私和使用权的担忧 , 还可以编辑生成模型以删除某些属性 , 例如种族或性别 , 这可以解决传统数据集中存在的一些偏见 。 (澎湃新闻采访人员 邵文)
推荐阅读
- 邵文|Cerebras:超大AI芯片比GPU更适于医疗数据分析
- 最新消息|印度首富收购荷兰电池制造商Lithium Werks
- 消委会|遭遇“大数据杀熟”?这份避“坑”指南请收好
- 科技计划项目|打破“数据孤岛” 政策精准秒达
- 重力场|我国首次使用国产自主卫星测出全球重力场数据
- 结果|丽珠V-01 Ⅲ期数据保护力满足WHO标准 “老年组”数据成亮点
- 最新消息|腾讯和阿里市值一年蒸发6万亿人民币
- 最新消息|出租屋产假星巴克外卖达729单 星巴克回应:已参与该案件调查
- 影响|活得“凉爽”能延寿?最新研究厘清代谢和体温对寿命的影响
- 冷却|正式启用!微软智能云Azure在华新增数据中心区域