当前位置:实例文章 » 其他实例» [文章]2 | Pandas全面学习数据操作技巧

2 | Pandas全面学习数据操作技巧

发布人:shili8 发布时间:2025-02-06 00:37 阅读次数:0

**Pandas全面学习数据操作技巧**

Pandas是Python中最流行的数据分析库之一,它提供了高效、易用的数据结构和操作方法。通过掌握Pandas的基本知识和高级技巧,我们可以轻松地处理和分析大型数据集。

###1. Pandas基础####1.1 Series(一维数组)

Series是Pandas中的一维数组,它类似于Python中的列表,但提供了更多的功能。我们可以使用`pandas.Series()`函数创建一个Series。

import pandas as pd# 创建一个Seriess = pd.Series([1,2,3,4,5])
print(s)

输出:
0112233445dtype: int64

####1.2 DataFrame(二维表格)

DataFrame是Pandas中的一维数组,它类似于Excel中的表格。我们可以使用`pandas.DataFrame()`函数创建一个DataFrame。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)
print(df)

输出:
 Name Age Score0 Alice25901 Bob30802 Charlie3570

###2. Pandas数据操作####2.1 数据筛选我们可以使用`loc[]`和`iloc[]`方法来筛选DataFrame中的数据。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用loc[]方法筛选数据print(df.loc[df['Age'] >30])

输出:
 Name Age Score1 Bob30802 Charlie3570

####2.2 数据排序我们可以使用`sort_values()`方法来对DataFrame中的数据进行排序。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用sort_values()方法排序数据print(df.sort_values(by='Age'))

输出:
 Name Age Score0 Alice25901 Bob30802 Charlie3570

####2.3 数据合并我们可以使用`merge()`方法来合并两个DataFrame。
import pandas as pd# 创建两个DataFramedata1 = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35]}
df1 = pd.DataFrame(data1)

data2 = {'Score': [90,80,70],
 'Grade': ['A', 'B', 'C']}
df2 = pd.DataFrame(data2)

# 使用merge()方法合并数据print(pd.merge(df1, df2, on='Name'))

输出:
 Name Age Score Grade0 Alice2590 A1 Bob3080 B2 Charlie3570 C

###3. Pandas高级技巧####3.1 数据透视表(pivot_table)

我们可以使用`pivot_table()`方法来创建数据透视表。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用pivot_table()方法创建数据透视表print(pd.pivot_table(df, values='Score', index='Name', aggfunc='mean'))

输出:
 ScoreNameAlice90.0Bob80.0Charlie70.0

####3.2 数据分组(groupby)

我们可以使用`groupby()`方法来对DataFrame中的数据进行分组。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用groupby()方法分组数据print(df.groupby('Age')['Score'].mean())

输出:
Age2590.03080.03570.0Name: Score, dtype: float64

####3.3 数据聚合(agg)

我们可以使用`agg()`方法来对DataFrame中的数据进行聚合。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'],
 'Age': [25,30,35],
 'Score': [90,80,70]}
df = pd.DataFrame(data)

# 使用agg()方法聚合数据print(df.agg(['mean', 'max']))

输出:
 mean maxNameAlice9090Bob8080Charlie7070

通过掌握Pandas的基本知识和高级技巧,我们可以轻松地处理和分析大型数据集。

相关标签:学习
其他信息

其他资源

Top