2 | Pandas全面学习数据操作技巧
发布人:shili8
发布时间:2025-02-06 00:37
阅读次数:0
**Pandas全面学习数据操作技巧**
Pandas是Python中最流行的数据分析库之一,它提供了高效、易用的数据结构和操作方法。通过掌握Pandas的基本知识和高级技巧,我们可以轻松地处理和分析大型数据集。
###1. Pandas基础####1.1 Series(一维数组)
Series是Pandas中的一维数组,它类似于Python中的列表,但提供了更多的功能。我们可以使用`pandas.Series()`函数创建一个Series。
import pandas as pd# 创建一个Seriess = pd.Series([1,2,3,4,5]) print(s)
输出:
0112233445dtype: int64
####1.2 DataFrame(二维表格)
DataFrame是Pandas中的一维数组,它类似于Excel中的表格。我们可以使用`pandas.DataFrame()`函数创建一个DataFrame。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) print(df)
输出:
Name Age Score0 Alice25901 Bob30802 Charlie3570
###2. Pandas数据操作####2.1 数据筛选我们可以使用`loc[]`和`iloc[]`方法来筛选DataFrame中的数据。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) # 使用loc[]方法筛选数据print(df.loc[df['Age'] >30])
输出:
Name Age Score1 Bob30802 Charlie3570
####2.2 数据排序我们可以使用`sort_values()`方法来对DataFrame中的数据进行排序。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) # 使用sort_values()方法排序数据print(df.sort_values(by='Age'))
输出:
Name Age Score0 Alice25901 Bob30802 Charlie3570
####2.3 数据合并我们可以使用`merge()`方法来合并两个DataFrame。
import pandas as pd# 创建两个DataFramedata1 = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35]} df1 = pd.DataFrame(data1) data2 = {'Score': [90,80,70], 'Grade': ['A', 'B', 'C']} df2 = pd.DataFrame(data2) # 使用merge()方法合并数据print(pd.merge(df1, df2, on='Name'))
输出:
Name Age Score Grade0 Alice2590 A1 Bob3080 B2 Charlie3570 C
###3. Pandas高级技巧####3.1 数据透视表(pivot_table)
我们可以使用`pivot_table()`方法来创建数据透视表。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) # 使用pivot_table()方法创建数据透视表print(pd.pivot_table(df, values='Score', index='Name', aggfunc='mean'))
输出:
ScoreNameAlice90.0Bob80.0Charlie70.0
####3.2 数据分组(groupby)
我们可以使用`groupby()`方法来对DataFrame中的数据进行分组。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) # 使用groupby()方法分组数据print(df.groupby('Age')['Score'].mean())
输出:
Age2590.03080.03570.0Name: Score, dtype: float64
####3.3 数据聚合(agg)
我们可以使用`agg()`方法来对DataFrame中的数据进行聚合。
import pandas as pd# 创建一个DataFramedata = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25,30,35], 'Score': [90,80,70]} df = pd.DataFrame(data) # 使用agg()方法聚合数据print(df.agg(['mean', 'max']))
输出:
mean maxNameAlice9090Bob8080Charlie7070
通过掌握Pandas的基本知识和高级技巧,我们可以轻松地处理和分析大型数据集。