随着**省国家电网电【diàn】力物联网的深入推进,各业务系【xì】统数据正在逐步汇聚至数据中心,针对某省国网数据质量低、数据冗余和数据异常等问题,基于数据中台进行重点治理提升。
建设成果
实现数据表内外关联分析,基于动态关联规则分析算法,实现对增量【liàng】数据的关联分析,并建立数据特征关联规则,为数据表的联合使用提供【gòng】支撑。
开发电力数据唯一性和完整性预处理模型,对源数据进行质量监测,分析数据存在的主要问题,为电力各业务场景提供高质量的数【shù】据支撑【chēng】。
实现电力文本类和数值类数据特征提取【qǔ】,采用自然语言处理技术和机器学习技术实现数据关系的定量表达和特征提取【qǔ】,提炼数据潜在规律。