当前位置：首页 > news >正文

线性可分支持向量机代码实现

news 2025/7/2 11:06:28

### 实现线性可分支持向量机
### 硬间隔最大化策略
class Hard_Margin_SVM:### 线性可分支持向量机拟合方法def fit(self, X, y):# 训练样本数和特征数m, n = X.shape# 初始化二次规划相关变量：P/q/G/hself.P = matrix(np.identity(n + 1, dtype=np.float))self.q = matrix(np.zeros((n + 1,), dtype=np.float))self.G = matrix(np.zeros((m, n + 1), dtype=np.float))self.h = -matrix(np.ones((m,), dtype=np.float))# 将数据转为变量self.P[0, 0] = 0for i in range(m):self.G[i, 0] = -y[i]self.G[i, 1:] = -X[i, :] * y[i]# 构建二次规划求解sol = solvers.qp(self.P, self.q, self.G, self.h)# 对权重和偏置寻优self.w = np.zeros(n,) self.b = sol['x'][0] for i in range(1, n + 1):self.w[i - 1] = sol['x'][i]return self.w, self.b### 定义模型预测函数def predict(self, X):return np.sign(np.dot(self.w, X.T) + self.b)

线性可分支持向量机的硬间隔最大化策略

该代码实现了线性可分支持向量机（SVM） 的硬间隔最大化策略。支持向量机是用于二分类问题的监督学习算法，而硬间隔策略意味着数据集是线性可分的，并且我们尝试通过最大化分类间隔来找到最优的决策边界。该实现依赖 cvxopt 库来求解一个二次规划问题。

以下是对代码的详细解释：

1. 类的定义

class Hard_Margin_SVM:

定义了一个名为 Hard_Margin_SVM 的类，用于实现硬间隔支持向量机。这个类有两个主要的方法：

fit()：训练模型的方法。
predict()：根据训练好的模型进行预测。

2. `fit()` 方法

def fit(self, X, y):

fit() 方法用于训练支持向量机模型，即根据给定的训练数据 $X$ 和标签 $y$ ，通过二次规划求解最优的权重 $w$ 和偏置 $b$ ，构建出最大化间隔的分类超平面。

(a) 训练样本数和特征数

m, n = X.shape

m 是训练样本的数量，n 是特征的维数。

(b) 初始化二次规划的参数矩阵

self.P = matrix(np.identity(n + 1, dtype=np.float))
self.q = matrix(np.zeros((n + 1,), dtype=np.float))
self.G = matrix(np.zeros((m, n + 1), dtype=np.float))
self.h = -matrix(np.ones((m,), dtype=np.float))

$P$ ：定义目标函数中的二次项。为了计算 $\frac{1}{2} w^T w$ ，P 被初始化为一个单位矩阵，其中额外的维度是为偏置项 $b$ 保留的。
$q$ ：定义目标函数中的线性项。在硬间隔 SVM 中，线性项为 0，所以初始化为零向量。
$G$ 和 $h$ ：定义约束条件 $\leq h$ 。G 用于约束支持向量的位置，h 是用来实现 $y_i(w \cdot x_i + b) \geq 1$ 的不等式条件，确保所有点都被正确分类且满足硬间隔条件。

(c) 设置 `P` 矩阵和 `G` 矩阵

self.P[0, 0] = 0
for i in range(m):self.G[i, 0] = -y[i]self.G[i, 1:] = -X[i, :] * y[i]

self.P[0, 0] = 0：确保 P 的第一项为 0，因为我们不需要对偏置项 $b$ 做二次惩罚。
self.G：构建了不等式约束矩阵 $G$ ，用于确保 $y_i (w \cdot x_i + b) \geq 1$ 。self.G[i, 0] 对应偏置项 $b$ ，self.G[i, 1:] 对应权重 $w$ 。

(d) 使用 `cvxopt.solvers.qp()` 进行二次规划求解

sol = solvers.qp(self.P, self.q, self.G, self.h)

cvxopt.solvers.qp() 是 cvxopt 中用于求解二次规划的函数。它使用矩阵 $P$ 、 $q$ 、 $G$ 、 $h$ 来构建二次规划问题，并返回最优解 sol。该最优解包含了权重 $w$ 和偏置 $b$ 。

(e) 提取权重 $w$ 和偏置 $b$

self.w = np.zeros(n,) 
self.b = sol['x'][0] 
for i in range(1, n + 1):self.w[i - 1] = sol['x'][i]

self.b：是从求解器中提取的偏置项 $b$ ，它是解向量 sol['x'] 的第一个元素。
self.w：是从解向量中提取的权重项 $w$ ，并且赋值给类的属性 self.w。

3. `predict()` 方法

def predict(self, X):return np.sign(np.dot(self.w, X.T) + self.b)

predict() 方法用于对新的数据 $X$ 进行预测：

$\text{np.dot(self.w, X.T)}$ ：计算数据点与权重向量 $w$ 的点积。
$\text{np.sign()}$ ：通过决策函数的符号来决定分类结果。如果结果为正，则归为正类；否则为负类。

4. 示例使用

以下是如何使用该类来训练和预测的示例：

import numpy as np
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt# 生成数据集
X, y = make_blobs(n_samples=100, centers=2, random_state=42)
y = 2 * (y - 0.5)  # 转换为 -1 和 1# 创建 SVM 实例
svm = Hard_Margin_SVM()# 训练模型
svm.fit(X, y)# 对数据集进行预测
y_pred = svm.predict(X)# 可视化分类结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='coolwarm')
plt.show()