当前位置: 首页 > news >正文

问:缓存穿透、雪崩、预热、击穿、降级,怎么办?

在现代互联网应用中,缓存技术被广泛使用以提高系统性能和响应速度。然而,缓存并非银弹,如果使用不当,可能会引发一系列问题,如缓存雪崩、缓存穿透、缓存预热、缓存更新和缓存降级等。这些问题如果处理不好,可能会对系统的稳定性和性能造成严重影响。本文将详细探讨这些问题及其解决方案。

一、缓存雪崩

定义
缓存雪崩是指由于大量缓存同时失效,导致大量请求直接访问数据库,从而对数据库造成巨大压力,甚至可能导致数据库宕机。这种情况通常发生在缓存设置了相同的过期时间,使得在同一时刻出现大面积的缓存过期。

场景
例如,一个电商网站在促销活动中,很多热门商品的缓存同时失效,大量用户请求这些商品的信息,这些请求直接访问数据库,导致数据库负载急剧增加,最终可能导致系统崩溃。

解决方案

  1. 分散缓存失效时间
    为了避免大量缓存同时失效,可以设置不同的过期时间,或者在缓存失效时加上一个随机时间。例如,可以在缓存的过期时间上加上一个0到几分钟的随机时间,这样就不会在同一时刻有大量缓存失效。

    import random
    import timedef set_cache(key, value):# 设置缓存过期时间为当前时间加上一个随机时间(0-300秒)expiration_time = time.time() + random.randint(0, 300)cache[key] = (value, expiration_time)
    
  2. 加锁或队列
    当缓存失效时,可以通过加锁或者队列的方式,控制对数据库的并发访问。例如,当缓存失效时,只有一个线程能够访问数据库,其他线程需要等待这个线程更新缓存后才能访问。这种方式虽然能够避免缓存雪崩,但可能会增加系统的响应时间。

    import threadinglock = threading.Lock()def get_data_from_db(key):with lock:# 从数据库获取数据data = db.query(key)set_cache(key, data)return data
    
  3. 不过期策略
    对于一些关键数据,可以采用不过期的策略,即这些数据一旦被缓存,就不会过期,除非手动更新或删除。这种方式可以避免缓存雪崩,但需要手动管理缓存,增加了系统的复杂性。

二、缓存穿透

定义
缓存穿透是指用户查询的数据在数据库中不存在,因此缓存中也不会存在。这样就导致每次用户查询时,缓存都无法命中,请求直接访问数据库,返回空结果。这种情况不仅浪费了系统资源,还可能被恶意用户利用,对数据库进行攻击。

场景
例如,一个黑客可能通过构造不存在的URL来攻击系统,这些请求都会绕过缓存,直接访问数据库,导致数据库压力增加,甚至可能被拖垮。

解决方案

  1. 布隆过滤器
    布隆过滤器是一种空间效率很高的数据结构,可以用来判断一个元素是否存在于一个集合中。系统可以将所有可能存在的数据哈希到一个足够大的布隆过滤器中,当一个查询请求到来时,首先通过布隆过滤器判断该数据是否存在,如果不存在,则直接返回空结果,避免了对数据库的查询。

    class BloomFilter:def __init__(self, size, hash_count):self.size = sizeself.hash_count = hash_countself.bit_array = [0] * sizedef add(self, item):for i in range(self.hash_count):index = hash(str(i) + item) % self.sizeself.bit_array[index] = 1def check(self, item):for i in range(self.hash_count):index = hash(str(i) + item) % self.sizeif self.bit_array[index] == 0:return Falsereturn True# 初始化布隆过滤器
    bloom_filter = BloomFilter(1000, 3)
    # 将可能存在的数据添加到布隆过滤器中
    bloom_filter.add("data1")
    bloom_filter.add("data2")# 检查数据是否存在
    print(bloom_filter.check("data1"))  # True
    print(bloom_filter.check("data3"))  # False
    
  2. 缓存空结果
    对于返回空结果的查询,可以将其结果缓存起来,设置一个很短的过期时间(如几分钟)。这样,当相同的查询再次到来时,可以直接从缓存中获取空结果,避免了对数据库的查询。需要注意的是,这种方式可能会缓存一些实际上应该返回数据的查询结果,因此需要根据实际情况谨慎使用。

    def get_data(key):if key in cache:return cache[key]# 检查布隆过滤器中是否存在if not bloom_filter.check(key):cache[key] = Nonereturn None# 从数据库获取数据data = db.query(key)if data is None:cache[key] = Noneelse:cache[key] = datareturn data
    
  3. 参数校验与限流
    在接口层进行参数校验,对于不合法或异常的请求直接拒绝。同时,可以对请求进行限流,避免过多的无效请求对系统造成压力。

    def validate_request(params):# 进行参数校验if not params.get("valid_param"):return Falsereturn Truedef rate_limit(request):# 实现限流逻辑passdef handle_request(request):if not validate_request(request.params):return "Invalid request"rate_limit(request)key = request.params.get("key")return get_data(key)
    
三、缓存预热

定义
缓存预热是指在系统启动或某些关键数据更新时,提前将可能需要的数据加载到缓存中,以提高系统的响应速度。

场景
例如,一个电商网站在促销活动开始前,可以提前将热门商品的信息加载到缓存中,这样在促销活动开始时,用户请求这些商品的信息时,可以直接从缓存中获取,提高了系统的响应速度。

解决方案

  1. 提前加载数据
    在系统启动或某些关键数据更新时,通过程序自动加载可能需要的数据到缓存中。这可以通过配置文件、数据库脚本或程序逻辑来实现。

    def preload_cache():# 从数据库加载热门商品信息popular_items = db.query_popular_items()for item in popular_items:set_cache(item.key, item.value)# 在系统启动时调用预加载函数
    preload_cache()
    
  2. 定时任务
    可以设置一个定时任务,定期从数据库或其他数据源中加载数据到缓存中。这种方式可以确保缓存中的数据始终是最新的,但需要注意定时任务的执行频率和性能影响。

    import timedef update_cache_periodically():while True:# 定期更新缓存preload_cache()time.sleep(3600)  # 每小时更新一次# 启动定时任务
    threading.Thread(target=update_cache_periodically).start()
    
  3. 触发更新
    当某些数据发生变化时,通过事件触发的方式更新缓存。例如,当商品信息更新时,可以触发一个事件来更新缓存中的商品信息。这种方式可以确保缓存中的数据与数据库中的数据保持一致,但需要处理好事件触发和缓存更新的逻辑。

    def on_item_update(item):set_cache(item.key, item.value)# 在商品信息更新时调用事件处理函数
    db.register_update_callback(on_item_update)
    
四、缓存更新

定义
缓存更新是指在缓存中的数据发生变化时,如何更新缓存中的数据,以确保缓存中的数据与数据库中的数据保持一致。

场景
例如,一个用户更新了商品信息,系统需要将更新后的商品信息加载到缓存中,以便其他用户能够获取到最新的商品信息。

解决方案

  1. LRU(Least Recently Used)算法
    这是一种常见的缓存替换算法,根据最近最少使用的原则来更新缓存。当缓存空间不足时,会淘汰最近最少使用的缓存项。这种方式可以确保缓存中的数据是最近常用的数据,但可能无法确保缓存中的数据与数据库中的数据完全一致。

    from collections import OrderedDictclass LRUCache:def __init__(self, capacity):self.cache = OrderedDict()self.capacity = capacitydef get(self, key):if key not in self.cache:return Noneelse:# 将该访问移动到末尾,表明是最近使用过self.cache.move_to_end(key)return self.cache[key]def set(self, key, value):if key in self.cache:# 更新已有的缓存项self.cache.move_to_end(key)self.cache[key] = valueif len(self.cache) > self.capacity:# 淘汰最近最少使用的缓存项self.cache.popitem(last=False)# 使用LRU缓存
    lru_cache = LRUCache(100)
    
  2. 缓存失效策略
    当数据库中的数据发生变化时,可以通过设置缓存失效的方式来更新缓存。例如,当商品信息更新时,可以设置一个标志位或版本号,当缓存中的数据与数据库中的数据不一致时,缓存即失效。下次用户请求时,会重新从数据库加载数据并更新缓存。

    def set_cache_with_version(key, value, version):cache[key] = (value, version)def get_cache_with_version(key, current_version):if key in cache:cached_value, cached_version = cache[key]if cached_version == current_version:return cached_valuereturn None# 在商品信息更新时更新版本号
    def update_item_in_db(item):# 更新数据库db.update(item)# 更新版本号item_version += 1# 更新缓存set_cache_with_version(item.key, item.value, item_version)
    
  3. 异步更新
    当数据库中的数据发生变化时,可以通过异步的方式更新缓存。例如,可以使用消息队列或异步任务框架(如Celery)来异步更新缓存。这种方式可以确保缓存中的数据与数据库中的数据最终一致,同时不会阻塞用户请求。

    def update_cache_async(key, value):# 异步更新缓存cache[key] = value# 在商品信息更新时发送异步更新消息
    def update_item_in_db(item):# 更新数据库db.update(item)# 发送异步更新消息async_task_queue.send(update_cache_async, item.key, item.value)
    
五、缓存降级

定义
缓存降级是指在系统压力增加或缓存服务不可用时,通过降级策略减少对缓存的依赖,以保证系统的基本功能和稳定性。

场景
例如,在一个高并发的场景下,缓存服务可能会因为压力过大而响应变慢或不可用,这时系统可以通过降级策略,减少对缓存的依赖,直接访问数据库或其他数据源,以保证系统的基本功能和稳定性。

解决方案

  1. 逐级降级
    可以设置多级的缓存降级策略,当一级缓存不可用时,降级到下一级缓存或数据源。例如,可以先使用Redis作为一级缓存,当Redis不可用时,降级到Memcached或数据库。

    def get_data(key):# 尝试从Redis获取数据data = redis_cache.get(key)if data is not None:return data# Redis不可用,降级到Memcacheddata = memcached_cache.get(key)if data is not None:return data# Memcached也不可用,降级到数据库return db.query(key)
    
  2. 部分降级
    可以根据系统的实际情况,选择部分数据进行降级。例如,对于一些关键数据,可以继续使用缓存,而对于一些非关键数据,可以降级到数据库或其他数据源。

    def get_data(key, is_critical):if is_critical:# 关键数据,继续使用缓存return redis_cache.get(key)else:# 非关键数据,降级到数据库return db.query(key)
    
  3. 平滑降级
    可以通过一些平滑的降级策略,减少对用户体验的影响。例如,当缓存不可用时,可以逐步减少缓存的使用,同时增加对数据库或其他数据源的访问,以避免突然的性能下降。

    def get_data(key):try:# 尝试从缓存获取数据data = redis_cache.get(key)if data is not None:return dataexcept Exception as e:# 缓存不可用,记录日志logging.error("Redis cache error: %s", e)# 缓存不可用,平滑降级到数据库return db.query(key)
    
六、缓存击穿

缓存击穿是指在高并发访问场景下,某个热点数据在缓存中失效后,在缓存重建的短时间内,大量请求直接访问数据库,导致数据库压力剧增,甚至可能宕机的现象。这种情况通常发生在一些关键数据上,这些数据被频繁访问且对业务至关重要。

示例说明
场景设定

假设有一个电商平台的商品信息系统,其中某个热门商品的详情数据被大量用户频繁访问。为了提高系统性能,该商品详情数据被缓存在Redis中,设置了一个有效期(比如10分钟)。正常情况下,数据从缓存读取,系统响应迅速。

缓存击穿发生

某个时刻,这个热门商品的缓存数据恰好到期失效。恰好在此时,由于某种原因(如促销活动开始),大量用户同时请求该商品的详情。因为这些请求发现缓存中没有数据,于是都直接访问数据库去查询,导致数据库瞬间承受巨大压力,查询变得非常缓慢,甚至可能导致数据库崩溃,服务不可用。

影响分析

缓存击穿会严重影响用户体验,因为请求变得非常慢或者根本得不到响应。同时,对后端数据库造成极大冲击,可能导致整个系统稳定性受到影响,尤其是在业务高峰期,这种影响将是灾难性的。

解决方案
  1. 互斥锁(Mutex):在缓存失效时,不是让所有请求都去数据库查询,而是只让一个请求去查询数据库并重建缓存,其他请求则等待或者返回旧数据。这可以通过分布式锁(如Redis的SETNX命令)来实现。

  2. 提前主动刷新缓存:在缓存即将失效之前,主动重新从数据库加载数据并更新缓存,避免缓存失效后的高峰期访问直接打到数据库上。这要求有精确的时间控制和额外的监控机制。

  3. 永不过期策略:对于一些特别关键的数据,可以考虑设置其为永不过期,虽然这会牺牲一定的缓存空间,但可以有效避免缓存击穿的风险。

  4. 限流降级:在数据库访问压力过大时,通过限流策略减少请求数量,或者返回降级后的数据(如缓存的旧数据或默认值),保护系统不至于完全崩溃。

互斥锁的例子

这里以使用互斥锁(Mutex)来防止缓存击穿为例,使用Python和Redis进行说明。

import redis
import time# 连接到Redis服务器
redis_client = redis.StrictRedis(host='localhost', port=6379, db=0)# 模拟数据库查询
def query_database(key):# 在实际应用中,这里应该是查询数据库的逻辑# 为了简化,我们假设数据库查询总是返回同一个值return "database_value"# 获取数据,使用互斥锁防止缓存击穿
def get_data_with_mutex(key, expiration=10):# 尝试从缓存中获取数据value = redis_client.get(key)if value:return value# 缓存失效,尝试获取互斥锁lock_key = f"lock:{key}"lock_acquired = redis_client.set(lock_key, "1", nx=True, ex=5)  # 锁有效期为5秒if lock_acquired:try:# 查询到数据后,更新缓存value = query_database(key)redis_client.set(key, value, ex=expiration)finally:# 释放互斥锁redis_client.delete(lock_key)else:# 等待锁释放,这里可以选择等待一定时间后重试,或者直接返回旧数据/默认值time.sleep(0.1)return get_data_with_mutex(key, expiration)return value# 示例调用
key = "popular_item"
print(get_data_with_mutex(key))
  1. 连接到Redis:首先,我们创建一个Redis客户端来连接到Redis服务器。

  2. 模拟数据库查询query_database函数模拟了一个数据库查询操作,在实际应用中,这里会执行查询数据库的逻辑。

  3. 获取数据函数get_data_with_mutex函数实现了使用互斥锁来防止缓存击穿。它首先尝试从缓存中获取数据,如果缓存中有数据,则直接返回。

  4. 互斥锁逻辑:如果缓存中没有数据,函数会尝试获取一个互斥锁(使用Redis的SET命令,nx=True表示只有当键不存在时才设置,ex=5表示锁的有效期为5秒)。

  5. 数据库查询与缓存更新:如果成功获取锁,函数会查询数据库,并将结果更新到缓存中。无论查询是否成功,最后都会释放互斥锁(通过删除锁键)。

  6. 等待锁释放:如果未能获取锁(表示其他进程正在查询数据库并更新缓存),函数会等待一段时间(这里是0.1秒),然后重新尝试获取数据。这种等待和重试的策略可以根据实际需求进行调整。

  7. 示例调用:最后,我们调用get_data_with_mutex函数来获取数据,这个函数会确保即使在缓存失效的情况下,也不会有大量请求直接打到数据库上。

结语

缓存技术在提高系统性能和响应速度方面具有重要作用,但也会带来一些潜在的问题。通过合理的设计和解决方案,可以有效地解决这些问题,确保系统的稳定性和性能。本文详细探讨了缓存雪崩、缓存穿透、缓存预热、缓存更新和缓存降级等常见问题及其解决方案。在实际应用中,需要根据系统的具体情况和需求,选择合适的缓存策略和解决方案,以实现最佳的系统性能和稳定性。


http://www.mrgr.cn/news/61628.html

相关文章:

  • DDD - 聚合、聚合根、仓库与工厂
  • SEO内容优化:如何通过用户需求赢得搜索引擎青睐?
  • Kafka 会丢消息吗?
  • git问题
  • 排序的本质、数据类型及算法选择
  • 【如何从0到1设计测试用例使用Fiddler完成弱网测试】
  • springboot入门学习笔记2(连接mysql,使用mybatis,plus等)
  • 优维好案例:某银行系理财公司的IT基础资源服务管理平台
  • 支持向量机(Support Vector Machines, SVM)详细解读
  • python画图|被忽视的坐标轴比例ax.set_box_aspect()函数
  • 使用 OpenCV 进行人眼检测
  • 从零到一:大学新生编程入门攻略与成长指南
  • CAN总线物理层&基础特性
  • H3C M-LAG 实验
  • 名词(术语)了解 -- SSG
  • Java 中 JSONObject 遍历属性并删除的几种方法对比
  • TypeScript 泛型
  • thrift idl 语言基础学习
  • ConcurrentHashMap【核心源码讲解】
  • Python——命令行计算器
  • Vim编辑器的应用与实践:让你的文本编辑更高效
  • 微服务设计模式 - 重试模式(Retry Pattern)
  • 17.网工入门篇--------介绍一下WLAN
  • 中国分省统计面板数据(2004-2023)-最新出炉_附下载链接
  • 信发软件之文字选择字体和颜色——未来之窗行业应用跨平台架构
  • 鸿蒙开发培训要多久