热搜词:

山东浪潮申请用于大模型训练优化的数据增强方法专利,提高了数据集的丰富性和多样性

金融界2025年5月3日消息,国家知识产权局信息显示,山东浪潮科学研究院有限公司申请一项名为“一种用于大模型训练优化的数据增强方法、装置、设备及介质”的专利,公开号CN119903935A,申请日期为2024年11月。

专利摘要显示,本发明属于计算机视觉技术领域,具体涉及一种用于大模型训练优化的数据增强方法、装置、设备及存储介质,所述方法包括如下步骤:构建用于生成任务样本对的任务模板函数;通过多次调用不同类型的任务模板函数生成多样化的数据样本生成混合数据集;根据每个任务对应的模板生成的数据训练模型得到模型集合M;基于模型集合对任务的样本数据进行预测,并根据模型的预测结果和真实标签,计算评估指标值,并根据评估指标的值,得出每个任务的精度;基于每个任务的精度使用Softmax函数计算任务模板的权重;根据任务模板的权重,调整混合数据集中不同任务类型的数据比例,生成增强数据集。提高了数据集的丰富性和多样性。

天眼查资料显示,山东浪潮科学研究院有限公司,成立于2021年,位于济南市,是一家以从事研究和试验发展为主的企业。企业注册资本20000万人民币。通过天眼查大数据分析,山东浪潮科学研究院有限公司共对外投资了1家企业,参与招投标项目97次,财产线索方面有商标信息22条,专利信息2131条,此外企业还拥有行政许可5个。

本文源自:金融界

作者:情报员