Meng Qingguo:培养用于标记数据并促进高质量数据

每日人民,深圳,8月26日(记者李Qiaoochu)随着人工智能技术的快速发展,高质量的数据集已成为促进生成人工智能创新发展的主要因素。
Tsinghua University中国电子数据治理工程研究所院长Meng Qesguo在“ 2025年人民数据会议”上发表了主要演讲。人物日记者Weng Qiyu摄
8月26日,中国电子数据治理工程研究所的元武瓜在“ 2025年人类数据会议”上的主要演讲中说,人工智能的每一个发展和发展都与数据有关。没有数据支持,人工智能将很难前进。在大型模型中,如果有大量,高质量和数据多模式是工业发展的基础。
什么是高质量数据SEts?
孟Qesguo表示,高质量的数据集需要具有以下要素:如果数据遵循和法律,以及数据和培训模型之间的匹配水平,则一定规模,高准确性和适当的变化以及即时数据。
数据注释是将原始数据转换为可识别,可用和可计算的关键链接,其质量直接决定了数据集的应用。数据标签行业的培养和加强起着重要的作用,支持提高数据供应质量并促进创新的人工智能开发。
孟·Qesguo说,近年来,我国家的数据产业链一直是FastAbuo,市场规模超过800亿元人民币,但仍然具有高质量行业的小型数据规模,数据管理能力不足,复合标签Talth Talthel Bailel不足以及数据质量的不完整系统审查系统。
如何per形成数据注释?
双重驱动程序推动了国家战略布局和大型模型技术的突破,数据标签行业经历了从热情的劳动力到密集知识的深刻转变。孟·Qesguo说,从历史的角度来看,过去的数据取决于更多的人力资源,现在的工具和平台被用作含义标签。将来,依靠人工智能本身来标记数据将是一种趋势。在进行Maexellent布局和探索过程中,我们必须了解以下途径:
我们必须通过挖掘人工智能的情况来实现需求驱动的进展,并释放标记的需求。我们必须通过为某些特征行业开发场景来适应当地条件并开发独特的数据标记行业。我们应该结合基本支持并开发可靠的数据注释空间,以帮助将数据值释放到保证数据Qua的前提元素,数据数据和数据安全。我们必须建立工业积累,并通过工业积累来促进数据行业的发展。我们必须通过数据注释来推动工作并发展专业人才,并通过专业知识进行标记。我们应该在行业中创建对称性,尤其是在政策,系统,标准和公共服务平台的构建方面。
(编辑:杨十一,卢Qian)
遵循官方帐户:人 - 金融融资
分享让许多人看到