当前位置: 首页 > news >正文

用Python实现时间序列模型实战——Day 24: 时间序列中的贝叶斯方法

一、学习内容
1. 贝叶斯时间序列分析的基本概念

贝叶斯方法基于贝叶斯统计,通过对数据的先验分布和似然函数进行推断,更新为后验分布。贝叶斯时间序列分析使用贝叶斯推断处理时间序列中的不确定性,适合处理复杂、不确定性高的时间序列问题。

贝叶斯时间序列模型能够自然地融合不同的信息源,并对不确定性进行定量描述。贝叶斯结构时间序列模型 (BSTS) 是一种常见的贝叶斯时间序列模型,它结合了状态空间模型和贝叶斯推断来进行建模和预测。

2. 基于贝叶斯推断的时间序列模型

贝叶斯时间序列模型的基本过程是通过先验分布、似然函数和后验分布来进行推断。常见的贝叶斯时间序列模型包括:

  • BSTS(贝叶斯结构时间序列):适合处理带有趋势、季节性、回归等特征的时间序列。
  • 贝叶斯动态线性模型(Bayesian Dynamic Linear Model, DLM):适用于随时间变化的线性动态系统。
3. 时间序列中的不确定性处理与预测

贝叶斯方法的一个优势是能够很好地处理不确定性,并通过后验分布的预测结果,给出预测的置信区间。在时间序列预测中,可以通过预测的后验分布来量化预测的不确定性。

二、实战案例

面是使用 PyTorchPyro 构建贝叶斯时间序列模型的代码。

import torch
import torch.nn as nn
import pyro
import pyro.distributions as dist
from pyro.infer import SVI, Trace_ELBO
from pyro.optim import Adam
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler# 1. 数据加载与预处理
url = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv'
data = pd.read_csv(url, header=0, parse_dates=['Month'], index_col='Month')# 数据标准化处理
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data[['Passengers']])# 生成滞后特征
def create_lagged_features(data, lag=1):X, y = [], []for i in range(len(data) - lag):X.append(data[i:i + lag])y.append(data[i + lag])return np.array(X), np.array(y)# 使用滞后步长为12个月的数据
lag = 12
X, y = create_lagged_features(scaled_data, lag=lag)# 划分训练集和测试集
train_size = int(len(X) * 0.8)
X_train, X_test = torch.tensor(X[:train_size], dtype=torch.float32), torch.tensor(X[train_size:], dtype=torch.float32)
y_train, y_test = torch.tensor(y[:train_size], dtype=torch.float32), torch.tensor(y[train_size:], dtype=torch.float32)# 2. PyTorch 模型
class BayesianLSTM(nn.Module):def __init__(self, input_size, hidden_size):super(BayesianLSTM, self).__init__()self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)self.fc = nn.Linear(hidden_size, 1)def forward(self, x):lstm_out, _ = self.lstm(x)output = self.fc(lstm_out[:, -1, :])return output# 3. Pyro 模型定义
def model(x_data, y_data=None):# 定义先验分布hidden_size = 50input_size = x_data.shape[-1]# 权重的先验分布lstm_weight_prior = dist.Normal(torch.zeros(hidden_size, input_size), torch.ones(hidden_size, input_size))lstm_bias_prior = dist.Normal(torch.zeros(hidden_size), torch.ones(hidden_size))# 全连接层的权重与偏置的先验fc_weight_prior = dist.Normal(torch.zeros(1, hidden_size), torch.ones(1, hidden_size))fc_bias_prior = dist.Normal(torch.zeros(1), torch.ones(1))# 定义 Pyro 参数priors = {'lstm.weight_ih_l0': lstm_weight_prior,'lstm.bias_ih_l0': lstm_bias_prior,'fc.weight': fc_weight_prior,'fc.bias': fc_bias_prior}# 使用 Pyro 模型bayesian_lstm = pyro.module('bayesian_lstm', BayesianLSTM(input_size, hidden_size))# 预测prediction = bayesian_lstm(x_data)# 似然函数with pyro.plate('data', len(x_data)):likelihood = dist.Normal(prediction, torch.tensor(0.1))obs = likelihood.log_prob(y_data) if y_data is not None else likelihoodreturn obs# 4. 损失函数和优化器
def guide(x_data, y_data=None):# 引导函数用于推断模型参数pyro.module('bayesian_lstm', BayesianLSTM(input_size=X_train.shape[-1], hidden_size=50))# 使用 SVI 进行推断
optim = Adam({"lr": 0.01})
svi = SVI(model, guide, optim, loss=Trace_ELBO())# 5. 模型训练
num_iterations = 1000
losses = []
for epoch in range(num_iterations):loss = svi.step(X_train, y_train)losses.append(loss)if epoch % 100 == 0:print(f"Epoch {epoch}, Loss: {loss}")# 6. 模型预测
bayesian_lstm = BayesianLSTM(input_size=X_train.shape[-1], hidden_size=50)
bayesian_lstm.eval()
y_pred = bayesian_lstm(X_test).detach().numpy()# 还原到原始数据尺度
y_test_rescaled = scaler.inverse_transform(y_test)
y_pred_rescaled = scaler.inverse_transform(y_pred)# 7. 结果可视化
plt.figure(figsize=(12, 6))
plt.plot(data.index[-len(y_test):], y_test_rescaled, label='Actual Passengers')
plt.plot(data.index[-len(y_test):], y_pred_rescaled, label='Predicted Passengers', color='green')
plt.title('Bayesian Time Series Predictions with Pyro')
plt.xlabel('Date')
plt.ylabel('Number of Passengers')
plt.legend()
plt.grid(True)
plt.show()
三、代码解释
3.1 数据预处理
  • 使用航空乘客数据集,并进行标准化处理。通过滞后步长为12的方式生成特征和目标值,并将数据集划分为训练集和测试集。
3.2 贝叶斯模型定义
  • 使用 Pyro 库定义了一个贝叶斯 LSTM 模型。模型的权重和偏置采用正态分布作为先验,模型使用 LSTM 进行序列建模,并通过贝叶斯推断学习参数。
3.3 模型训练
  • 使用 SVI (Stochastic Variational Inference) 进行贝叶斯推断,使用 Trace_ELBO 作为损失函数来优化模型。
3.4 模型预测与可视化
  • 使用训练好的贝叶斯模型对测试集进行预测,并将预测结果与真实数据进行对比,通过图形可视化结果。
四、结果输出

五、结果分析
5.1 预测结果
  • 贝叶斯 LSTM 模型可以对时间序列数据进行预测,并对结果进行不确定性量化。
  • 由于我们使用了贝叶斯推断,预测结果能够根据数据的变化动态调整。
5.2 不确定性处理
  • 在未来预测中,通过使用贝叶斯推断,能够更好地量化预测的不确定性。
六、总结

本次案例中,我们使用 PyroPyTorch 构建了贝叶斯时间序列模型,通过贝叶斯推断进行了 LSTM 参数的学习与优化。通过此方法,我们能够为时间序列任务提供具有不确定性估计的预测结果。


http://www.mrgr.cn/news/29163.html

相关文章:

  • Rust GUI框架Tauri V1 入门
  • C# 链表排序之归并排序
  • Rust GUI框架 tauri V2 项目创建
  • C++ MFC SnowWorld
  • 华为OD机试 - 阿里巴巴找黄金宝箱(V) - 滑动窗口(Python/JS/C/C++ 2024 E卷 100分)
  • 【编译原理】看书笔记
  • C++和OpenGL实现3D游戏编程【目录】
  • WebMagic:强大的Java网络爬虫框架
  • Python绘制基频曲线——实例解析与应用探讨
  • 最新腾讯高精度动作模仿模型MimicMotion分享
  • golang学习笔记27——golang 实现 RPC 模块
  • Golang | Leetcode Golang题解之第414题第三大的数
  • JavaScript:驱动现代Web应用的关键引擎及其与HTML/CSS的集成
  • 一天认识一个硬件之显示器
  • 如何在Java服务中实现数据一致性:事务与锁机制的综合应用
  • 【技术分享】走进Docker的世界:从基础到实战全面解析(Docker全流程)
  • golang学习笔记26——golang 实现节点筛选与负载均衡
  • Windows目录监控部署
  • Qt容器类控件——QGroupBox和QTabWidget
  • pythonnet python图像 C# .NET图像 互转