
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
缓存技术的应用在许多软件编程开发项目中都需要是非常常见的一个编程技术,而本文我们就通过案例分析来简单了解一下,缓存技术应用基础知识分享。
缓存特征
(1)命中率:命中数/(命中数+没有命中数)
(2)大元素(空间):代表缓存中可以存放的大元素的数量,一旦缓存中元素的数量超过这个值,或者缓存数据所占的空间超过了大支持的空间,将会触发缓存清空策略。根据不同的场景,合理设置大元素(空间)的值,在一定程度上可以提高缓存的命中率,从而更有效的使用缓存。
(3)清空策略:FINO(先进先出)、LFU(少使用)、LRU(近少使用)、过期时间、随机等。
FINO(先进先出):先进入缓存的数据,在缓存空间不够或超出大元素限制的情况下,会优先被清除掉,以腾出新的空间来接收新的数据。这种策略的算法主要是比较缓存元素的创建时间,在数据实时性较高的场景下,可以选择这种策略,优先保证新策略可用。
LFU(少使用):无论元素是否过期,根据元素的被使用次数来判断,清除使用次数少的元素来释放空间。算法主要是比较元素的命中次数,在保证高频数据有效的场景下,可以选择这种策略。
LRU(近少使用):无论元素是否过期,根据元素后一次被使用的时间戳,清除远使用时间戳的元素,释放空间。算法主要是比较元素近一次被获取的时间,在热点数据场景下,可以选择这种策略。
过期时间:根据过期时间判断,清理过期时间长的元素,或者清理近要过期的元素。
缓存命中率影响因素
(1)业务场景和业务需求
缓存往往适合读多写少的场景。业务需求对实时性的要求,直接会影响到缓存的过期时间和更新策略。实时性要求越低,就越适合缓存。在相同Key和相同请求数的情况下,缓存的时间越长,命中率就会越高。
(2)缓存的设计(粒度和策略)
通常情况下,缓存的粒度越小,命中率越高。缓存的更新和命中策略也会影响缓存的命中率,当数据发生变化时,直接更新缓存的值会比移除缓存或使缓存过期的命中率更高。
(3)缓存容量和基础设施
缓存的容量有限,则容易引起缓存失效和被淘汰(目前多数的缓存框架或中间件都采用了LRU算法)。同时,缓存的技术选型也是至关重要的,比如采用应用内置的本地缓存就比较容易出现单机瓶颈,而采用分布式缓存则毕竟容易扩展。所以需要做好系统容量规划,并考虑是否可扩展。此外,不同的缓存框架或中间件,其效率和稳定性也是存在差异的。
(4)其他因素
当缓存节点发生故障时,需要避免缓存失效并大程度降低影响,这种特殊情况也是架构师需要考虑的。业内比较的做法就是通过一致性Hash算法,或者通过节点冗余的方式。
有些朋友可能会有这样的理解误区:既然业务需求对数据时效性要求很高,而缓存时间又会影响到缓存命中率,那么系统就别使用缓存了。其实这忽略了一个重要因素–并发。通常来讲,在相同缓存时间和key的情况下,并发越高,缓存的收益会越高,即便缓存时间很短。
提高缓存命中率的方法
从架构师的角度,需要应用尽可能的通过缓存直接获取数据,并避免缓存失效。这也是比较考验架构师能力的,需要在业务需求,缓存粒度,缓存策略,技术选型等各个方面去通盘考虑并做权衡。尽可能的聚焦在高频访问且时效性要求不高的热点业务上,通过缓存预加载(预热)、增加存储容量、调整缓存粒度、更新缓存等手段来提高命中率。
对于时效性很高(或缓存空间有限),内容跨度很大(或访问很随机),并且访问量不高的应用来说缓存命中率可能长期很低,可能预热后的缓存还没来得被访问就已经过期了。
缓存的分类和应用场景
(1)本地缓存:编程实现(成员变量、局部变量、静态变量)、GuavaCache
(2)分布式缓存:Memcached、Redis
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!请读者仅作参考。更多内容请加抖音达内三江区域学习了解。