
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
大数据技术应用随着互联网的不断发展而逐渐覆盖到了更多的行业领域之中,而本文我们就通过案例分析来简单了解一下,零基础学习大数据管理需要掌握哪些方法。
数据共享管理
数据共享管理主要是指开展数据共享和交换,实现数据内外部价值的一系列活动。数据共享管理包括数据内部共享(企业内部跨组织、部门的数据交换)、外部流通(企业之间的数据交换)、对外开放。
数据内部共享的关键步骤是打通企业内部各部门间的数据共享瓶颈,建立统一规范的数据标准与数据共享制度,数据外部流通和对外开放可以通过数据直接交易与提供数据分析信息的两种方式实现,将数据中符合共享开放层级的信息作为应用商品,以合规安全的形式完成共享交换或开放发布。
数据共享管理的关键活动包括:
定义数据资产内部共享和运营流通监控指标;
设计数据资产内部共享和运营流通管理方案;
制定数据资产内部共享和运营流通管理办法和实施
流程要求;
监控数据资产内部共享和运营实施;
监督落实数据内部共享与外部流通等合规性管理要求;
分析内部共享与运营流通指标,评价运营效果并改进。
生命周期管理
数据资产管理过程中,生命周期的管理也是非常重要的部分,每一类数据都有其价值周期,要设置一个合理的数据生命周期需要考虑各方面的因素。在数据中台的实践过程中,先会将数据分成两类:不可恢复的数据与可恢复的数据。一般涉及原始数据的,都会被定义为不可恢复数据,即清除后没办法找回来;而一些中间过程或者结果数据,只要原始数据在并且相关的加工逻辑在,都可以被重新加工恢复。因此在生命周期的管理策略上,也需要区别对待。
不可恢复数据
一般建议策略为永久保存,在实际实施过程中可以根据企业各方面因素来综合考虑。数据当前没价值不代表未来没有价值,只是当前的技术、认知和场景没有办法使用其中的价值。当然也需要从企业成本考虑,如果什么数据都存,成本部分又无法承受,那反而会将数据变成一种负债,拖累企业发展。在实施过程中,可以考虑冷数据用低价存储的方式,未来需要使用时再进行恢复,虽然可能会有一些效率上的浪费,但和实际的资金成本平衡后也是常常会选择的方式。
可恢复的数据
这类数据只需要有原始数据和加工模型在,就可以通过平台的调度策略进行恢复,因此这类数据的生命周期一般会根据实际使用情况来灵活调整。平台侧可以根据数据使用情况,推荐具体的生命周期保留时长,用户也可以自主选择设置,让生命周期的设置符合实际企业需要。
生命周期管理提供生命周期的设置和自动清理功能,还提供了生命周期建议的功能,即结合数据的热度、存储量变化情况给用户建议的生命周期,帮助用户合理配置。
标签管理
标签是一类重要的数据资产。把标签定义为对象的一种描述方法,成为更容易被理解、被识别的一种分类及描述的组织形式。业界常见的标签一般分成两类:
一类是数据的分类方式,如根据数据的来源、更新频率、归属部门等进行标识和分;
一类是对数据的内容进行重新描述甚至是重新组织的方式,如根据行为特点组织的还贷能力、某个属性从业务视角的重新定义等。
标签管理一般包含标签体系的管理、标签与数据映射关系、标签的应用管理。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。