
“传统模式下,数据反哺业务,形成‘数据飞轮’;AI兴起后,‘数据飞轮’升级为‘数据-智能-业务’三维飞轮,数据需通过智能环节实现对业务的精准赋能。”在近日举办的2025数据要素发展大会上,中国信通院云计算与大数据研究所姜春宇主任表示。
在本次大会上,姜春宇发表了《高质量数据集建设观察》的主题演讲,聚焦十大重点行业,系统阐述了政策支持下高质量数据集建设的技术与应用进展,剖析了当前面临的制度、标准、技术、生态等层面挑战,展望了中短期技术普及与长期协同生态的发展趋势。
姜春宇表示股票行情今天配资,随着智能算力、模型训推等对数据集依赖的日益加深,高质量数据集的重要性愈发凸显。在此背景下,我国政府通过一系列措施,着力推动高质量数据集建设,从“人工智能+”行动的顺利发布,到《高质量数据集建设指引》对外亮相,政策层面已形成多层次的支撑体系。
据姜春宇观察,伴随高质量数据集的建设,各类交易平台已开始上架高质量数据集,以央国企等行业龙头为建设主体,成为推动建设工作的核心力量。姜春宇介绍,为进一步推动重点行业高质量数据集建设,中国信通院在国资委支持下开展了专项调研,覆盖10个重点行业、20家重点央企,通过实践调研、专家访谈等,全面掌握行业高质量数据集建设情况。
姜春宇介绍了十大行业的数据特点:在智能能源领域,石油天然气数据具有碎片化特点,电网运行数据具有高保密特征;在工业制造领域,数据具有多源性、强时序性、高价值性等特征;在绿色低碳领域,数据涉及范围广、来源丰富、跨领域性强、国际化程度高;在金融服务领域,存在结构化、半结构化、非结构化等多种数据;在交通物流领域,细分领域较多,数据模态较为丰富;在农业农村,数据来源广泛,时间依赖性和季节属性强,部分领域存在噪声多、缺失多、来源分散的问题;在医疗卫生领域,数据具有高敏感、专业性和格式多样的特点,在隐私性、完整性和安全合规方面要求严格;在应急管理方面,数据分散在多部门、多区域、多系统之间,存在采集标准不统一、数据互通不畅的问题;在移动通信领域,数据规模庞大、实时性强、关联度高;在文化旅游领域,数据具有多模态、多来源、长尾分布明显、情感表达丰富、审美标准多元、依赖文化语境的特点。
在分析十大行业数据特点的同时,姜春宇也发现了行业高质量数据集建设存在四大挑战:制度机制不健全、标准体系未完善、技术能力较薄弱、数据生态较局限。他介绍,中国信通院制定了一系列标准体系,指导企业构建研发、交付、运维、运营一体化的生产流程;搭建了全方位服务能力,涵盖质量评价、建设运营评估、技术支撑等;形成了平台工具的技术规范,明确数据处理与管理的技术要求;构建了高质量数据集标准体系,为业界提供参考。
展望未来,姜春宇表示,高质量数据集建设工作刚刚起步,后续需在制度、标准、技术、生态等方面形成合力,充分发挥数据、智能与业务的飞轮效应,形成繁荣、可持续的产业生态,持续赋能各行业智能化转型。
配资官方开户提示:文章来自网络,不代表本站观点。