西瓜书读书笔记整理(四)—— 第三章 线性模型
发布人:shili8
发布时间:2024-12-29 19:36
阅读次数:0
**西瓜书读书笔记整理(四)——第三章 线性模型**
**第三章 线性模型**
线性模型是机器学习中最基本也是最重要的模型之一。它可以用于预测连续值或分类问题。在本章,我们将介绍线性模型的基本概念、数学推导和实现。
###3.1 线性回归线性回归是一种常见的线性模型,用于预测连续值。假设我们有一个数据集 $(x_1, y_1), (x_2, y_2), ldots, (x_n, y_n)$,其中 $x_i$ 是输入特征,$y_i$ 是输出目标变量。
线性回归模型的基本形式是:
$$y = w^T x + b$$其中 $w$ 是权重向量,$b$ 是偏置项。
####3.1.1 线性回归的数学推导假设我们有一个数据集 $(x_1, y_1), (x_2, y_2), ldots, (x_n, y_n)$。我们希望找到一个线性模型 $y = w^T x + b$,使得预测值与实际值最接近。
我们可以使用均方误差(MSE)来衡量预测值与实际值之间的差异:
$$text{MSE} = frac{1}{n} sum_{i=1}^{n} (y_i - (w^T x_i + b))^2$$我们可以使用梯度下降法来优化权重 $w$ 和偏置项 $b$,使得 MSE 最小。
####3.1.2 线性回归的实现在 Python 中,我们可以使用 scikit-learn 库来实现线性回归模型:
from sklearn.linear_model import LinearRegressionimport numpy as np# 假设数据集X = np.array([[1,2], [3,4], [5,6]]) y = np.array([2,4,5]) # 实例化线性回归模型model = LinearRegression() # 训练模型model.fit(X, y) # 预测值print(model.predict(np.array([[7,8]])))
###3.2 线性分类线性分类是一种常见的线性模型,用于分类问题。假设我们有一个数据集 $(x_1, y_1), (x_2, y_2), ldots, (x_n, y_n)$,其中 $x_i$ 是输入特征,$y_i$ 是输出目标变量。
线性分类模型的基本形式是:
$$y = w^T x + b$$####3.2.1 线性分类的数学推导假设我们有一个数据集 $(x_1, y_1), (x_2, y_2), ldots, (x_n, y_n)$。我们希望找到一个线性模型 $y = w^T x + b$,使得预测值与实际值最接近。
我们可以使用逻辑回归来实现线性分类:
$$p(y=1|x) = frac{1}{1 + e^{-(w^T x + b)}}$$####3.2.2 线性分类的实现在 Python 中,我们可以使用 scikit-learn 库来实现逻辑回归模型:
from sklearn.linear_model import LogisticRegressionimport numpy as np# 假设数据集X = np.array([[1,2], [3,4], [5,6]]) y = np.array([0,1,1]) # 实例化逻辑回归模型model = LogisticRegression() # 训练模型model.fit(X, y) # 预测值print(model.predict(np.array([[7,8]])))
### 总结本章我们介绍了线性模型的基本概念、数学推导和实现。线性模型可以用于预测连续值或分类问题。在 Python 中,我们可以使用 scikit-learn 库来实现线性回归和逻辑回归模型。
**参考文献**
* Bishop, C. M. (2006). Pattern recognition and machine learning. Springer.
* Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. MIT Press.
**注释**
* 本文使用的 Python代码示例仅供参考,实际实现可能需要根据具体问题进行调整。
* 本文中提到的数学推导和实现仅为简要概述,详细内容请参见参考文献。