【Python提取Excel表格中符合条件的数据】

发布人：shili8 发布时间：2025-03-01 14:24 阅读次数：0

**Python提取Excel表格中符合条件的数据**

在实际工作中，我们经常需要从Excel表格中提取特定的数据。例如，根据某些条件筛选出满足要求的记录、统计某一列的值等。在这种情况下，Python是非常合适的选择，因为它提供了丰富的库和工具来处理Excel文件。

本文将介绍如何使用Python从Excel表格中提取符合条件的数据。我们将使用`pandas`库，这是Python最流行的数据分析库之一。

### 安装所需库首先，我们需要安装`pandas`库。如果你已经安装过，可以跳过这一步：

bashpip install pandas openpyxl

### 加载Excel文件我们使用`pandas.read_excel()`函数来加载Excel文件。这个函数支持多种格式的Excel文件，包括`.xlsx`、`.xls`和`.xlsm`。

import pandas as pd# 加载Excel文件df = pd.read_excel('example.xlsx')

### 查看数据我们可以使用`head()`方法来查看前几行数据：

print(df.head())

### 条件筛选现在，我们需要根据某些条件筛选出满足要求的记录。我们可以使用`query()`函数来实现这一点。

例如，假设我们有一个表格，其中包含学生的姓名、年龄和成绩。我们想找出年龄大于18岁且成绩大于80分的学生：

# 条件筛选filtered_df = df.query('age >18 and score >80')

### 统计如果你需要统计某一列的值，可以使用`value_counts()`函数。

例如，假设我们有一个表格，其中包含学生的姓名和成绩。我们想统计出每个成绩的数量：

# 统计score_counts = df['score'].value_counts()
print(score_counts)

###保存结果最后，我们可以使用`to_excel()`函数来将筛选出的数据保存为新的Excel文件。

#保存结果filtered_df.to_excel('result.xlsx', index=False)

### 总结在本文中，我们学习了如何使用Python从Excel表格中提取符合条件的数据。我们使用`pandas`库来加载和处理Excel文件，使用`query()`函数来筛选出满足要求的记录，并使用`value_counts()`函数来统计某一列的值。最后，我们将结果保存为新的Excel文件。

### 示例代码

import pandas as pd# 加载Excel文件df = pd.read_excel('example.xlsx')

# 条件筛选filtered_df = df.query('age >18 and score >80')

# 统计score_counts = df['score'].value_counts()

#保存结果filtered_df.to_excel('result.xlsx', index=False)

print(filtered_df.head())
print(score_counts)

### 注释* `pandas.read_excel()`函数支持多种格式的Excel文件，包括`.xlsx`、`.xls`和`.xlsm`。
* `query()`函数用于根据条件筛选出满足要求的记录。
* `value_counts()`函数用于统计某一列的值。
* `to_excel()`函数用于将数据保存为新的Excel文件。

上一条：TCP长连接和短连接

下一条：【业务功能篇51】对象复制的三种方式工具类Orika、反射、BeanUtils浅拷贝