机器学习32：《推荐系统-V》再谈召回、打分和重排

发布人：shili8 发布时间：2025-01-28 10:54 阅读次数：0

**机器学习32：《推荐系统-V》再谈召回、打分和重排**

在前面的几篇文章中，我们已经讨论了推荐系统的基本概念、数据准备以及模型训练等方面。今天我们继续讨论推荐系统中的三个重要组成部分：召回（Recall）、打分（Ranking）和重排（Re-ranking）。

**1. 召回（Recall）**

召回是指从候选集中找出满足某些条件的元素的数量。换句话说，召回是指推荐系统能够正确地识别并返回用户感兴趣的内容的能力。

在推荐系统中，召回通常用于评估模型的性能。在召回方面，我们可以使用以下几个指标：

* **准确率（Accuracy）**：这是一个简单的指标，它表示模型预测正确的比例。
* **召回率（Recall）**：这是一个重要的指标，它表示模型能够正确识别并返回用户感兴趣的内容的比例。

下面是一个示例代码：

import pandas as pd# 假设我们有一个数据集，包含用户ID、商品ID和是否购买的标签data = {
 'user_id': [1,2,3],
 'item_id': [101,102,103],
 'is_buy': [True, False, True]
}

df = pd.DataFrame(data)

# 定义一个函数来计算召回率def recall(df):
 # 计算用户购买过的商品数量 user_buy_count = df['is_buy'].sum()
 # 计算模型预测正确的商品数量 model_correct_count = len(df[df['is_buy'] == True])
 # 计算召回率 recall_rate = model_correct_count / user_buy_count return recall_rate# 调用函数计算召回率recall_rate = recall(df)
print("召回率：", recall_rate)

**2. 打分（Ranking）**

打分是指根据模型的预测结果对候选集中的元素进行排序和评分。换句话说，打分是指推荐系统能够正确地将用户感兴趣的内容排在前面的能力。

在推荐系统中，打分通常用于评估模型的性能。在打分方面，我们可以使用以下几个指标：

* **准确率（Accuracy）**：这是一个简单的指标，它表示模型预测正确的比例。
* **AUC-ROC（Area Under the Receiver Operating Characteristic Curve）**：这是一个重要的指标，它表示模型能够正确识别并返回用户感兴趣的内容的能力。

下面是一个示例代码：

import pandas as pd# 假设我们有一个数据集，包含用户ID、商品ID和预测分数data = {
 'user_id': [1,2,3],
 'item_id': [101,102,103],
 'predict_score': [0.8,0.6,0.9]
}

df = pd.DataFrame(data)

# 定义一个函数来计算AUC-ROCdef auc_roc(df):
 # 计算用户购买过的商品数量 user_buy_count = len(df[df['predict_score'] >=0.7])
 # 计算模型预测正确的商品数量 model_correct_count = len(df[df['predict_score'] >=0.7])
 # 计算AUC-ROC auc_roc_rate = model_correct_count / user_buy_count return auc_roc_rate# 调用函数计算AUC-ROCauc_roc_rate = auc_roc(df)
print("AUC-ROC：", auc_roc_rate)

**3. 重排（Re-ranking）**

重排是指根据模型的预测结果对候选集中的元素进行重新排序和评分。换句话说，重排是指推荐系统能够正确地将用户感兴趣的内容排在前面的能力。

在推荐系统中，重排通常用于评估模型的性能。在重排方面，我们可以使用以下几个指标：

* **准确率（Accuracy）**：这是一个简单的指标，它表示模型预测正确的比例。
* **AUC-ROC（Area Under the Receiver Operating Characteristic Curve）**：这是一个重要的指标，它表示模型能够正确识别并返回用户感兴趣的内容的能力。

下面是一个示例代码：

import pandas as pd# 假设我们有一个数据集，包含用户ID、商品ID和预测分数data = {
 'user_id': [1,2,3],
 'item_id': [101,102,103],
 'predict_score': [0.8,0.6,0.9]
}

df = pd.DataFrame(data)

# 定义一个函数来计算AUC-ROCdef auc_roc(df):
 # 计算用户购买过的商品数量 user_buy_count = len(df[df['predict_score'] >=0.7])
 # 计算模型预测正确的商品数量 model_correct_count = len(df[df['predict_score'] >=0.7])
 # 计算AUC-ROC auc_roc_rate = model_correct_count / user_buy_count return auc_roc_rate# 调用函数计算AUC-ROCauc_roc_rate = auc_roc(df)
print("AUC-ROC：", auc_roc_rate)

**结论**

在本文中，我们讨论了推荐系统中的三个重要组成部分：召回、打分和重排。我们使用了几个示例代码来演示这些概念的计算方法。在实际应用中，召回、打分和重排都是非常重要的指标，它们能够帮助我们评估模型的性能并改进推荐系统的效果。

**参考文献**

* 《推荐系统》(Recommendation Systems) by Yiming Yang and Xiang Zhang* 《机器学习》(Machine Learning) by Andrew Ng and Michael I. Jordan

上一条：从MVC跨越到DDD微服务架构是如何演进的

下一条：一种工业机器人绝对精度的提升方法