2 | Pandas全面学习数据操作技巧

发布人：shili8 发布时间：2025-02-06 00:37 阅读次数：0

**Pandas全面学习数据操作技巧**

Pandas是Python中最流行的数据分析库之一，它提供了高效、易用的数据结构和操作方法。通过掌握Pandas的基本知识和高级技巧，我们可以轻松地处理和分析大型数据集。

###1. Pandas基础####1.1 Series（一维数组）

Series是Pandas中的一维数组，它类似于Python中的列表，但提供了更多的功能。我们可以使用`pandas.Series()`函数创建一个Series。

import pandas as pd# 创建一个Seriess = pd.Series([1,2,3,4,5])
print(s)

输出：

0112233445dtype: int64

####1.2 DataFrame（二维表格）

DataFrame是Pandas中的一维数组，它类似于Excel中的表格。我们可以使用`pandas.DataFrame()`函数创建一个DataFrame。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)
print(df)

输出：

 Name Age Score0 Alice25901 Bob30802 Charlie3570

###2. Pandas数据操作####2.1 数据筛选我们可以使用`loc[]`和`iloc[]`方法来筛选DataFrame中的数据。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用loc[]方法筛选数据print(df.loc[df['Age'] >30])

输出：

 Name Age Score1 Bob30802 Charlie3570

####2.2 数据排序我们可以使用`sort_values()`方法来对DataFrame中的数据进行排序。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用sort_values()方法排序数据print(df.sort_values(by='Age'))

输出：

 Name Age Score0 Alice25901 Bob30802 Charlie3570

####2.3 数据合并我们可以使用`merge()`方法来合并两个DataFrame。

import pandas as pd# 创建两个DataFramedata1 = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35]}
df1 = pd.DataFrame(data1)

data2 = {'Score': [90,80,70],
 'Grade': ['A', 'B', 'C']}
df2 = pd.DataFrame(data2)

# 使用merge()方法合并数据print(pd.merge(df1, df2, on='Name'))

输出：

 Name Age Score Grade0 Alice2590 A1 Bob3080 B2 Charlie3570 C

###3. Pandas高级技巧####3.1 数据透视表（pivot_table）

我们可以使用`pivot_table()`方法来创建数据透视表。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用pivot_table()方法创建数据透视表print(pd.pivot_table(df, values='Score', index='Name', aggfunc='mean'))

输出：

 ScoreNameAlice90.0Bob80.0Charlie70.0

####3.2 数据分组（groupby）

我们可以使用`groupby()`方法来对DataFrame中的数据进行分组。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用groupby()方法分组数据print(df.groupby('Age')['Score'].mean())

输出：

Age2590.03080.03570.0Name: Score, dtype: float64

####3.3 数据聚合（agg）

我们可以使用`agg()`方法来对DataFrame中的数据进行聚合。

import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用agg()方法聚合数据print(df.agg(['mean', 'max']))

输出：

 mean maxNameAlice9090Bob8080Charlie7070

通过掌握Pandas的基本知识和高级技巧，我们可以轻松地处理和分析大型数据集。

上一条：win11 win+e 打开我的电脑

下一条：电影《碟中谍7：致命清算（上）》观后感