
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
数据仓库是目前大多数企业在运营发展过程中都会用到的一个互联网技术,下面我们就通过案例分析来简单了解一下,数据仓库优劣性判断方法都有哪些。
指标项
失败的离线任务个数
没有按时完成的任务个数
ODS同步超时的任务个数
数据准确性
对外的报表提供反馈机制,对数据准确性进行跟踪
数检平台的整个平台的数据准确性进行监控(到后期能不能利用机器学习去监控,否则你要定制大量的规则)
时效性
针对数仓的对外提供的数据能否满足失效性的需求
监控数仓任务的运行时长进行优化
能否快速响应业务的数据需求
覆盖性
我们主要指的是对数据域的覆盖情况
建构层次清晰
纵向的数据分层,横向的主题划分,业务过程划分,让整个层次结构清晰易理解
数据准确一致
定义一致性指标、统一命名规范、统一业务含义、统一计算口径,专业的建模团队
性能指标
通过统一的规划设计,选用合理的数据模型,清晰统一的规范,并且考虑数据的使用场景,使得整体性能更好
需要持续不断的业务逻辑重构,是整体的sql水平上升,提倡优化精神
成本指标
避免烟囱式的重复建设,节约计算、存储、人力成本。
易用性指标
复杂逻辑前置,降低业务方的使用门槛
通过冗余维度和事实表,进行公共计算逻辑下沉,明细与汇总共存等为业务提供灵活性
需求响速度
数仓建设的好,底层设施完善,报表开发人员就可以快速响应业务方的需求,跟上业务方快速试错、快速尝试的节奏
稳定性
稳定性影响了时效性,也就是决定了我们的数据能不能按时产出,衡量稳定性的方式,我们可以使用三个9,或者四个9,甚至是用每天失败的任务数除以总的任务数,我们的主要目标是得出一个相对合理的指标,从而不断的去优化它。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。