【Python】Python中使用Matplotlib绘制折线图、散点图、饼形图、柱形图和箱线图
Python是一种通用型编程语言,其在数据分析和数据可视化方面的应用广泛。而Matplotlib是Python中常用的数据可视化工具之一,它可以绘制各种类型的图表,如折线图、散点图、饼形图、柱形图和箱线图等。本文将介绍使用Matplotlib绘制这些不同类型图表的方法。 第一步是导入所需的库和数据文件。在这个实验中,我们需要导入pandas、matplotlib.pyplot和numpy三个库,以及数据文件employee.csv。代码如下: ```python import pandas as pd import matplotlib.pyplot as plt import numpy as np data = pd.read_csv("employee.csv") ``` 接下来,我们将根据数据文件绘制散点图和折线图。这里我们取出第一产业、第二产业和第三产业的就业人员数量,并根据时间轴绘制图表。 ```python x = data['year'] y1 = data['first_industry'] y2 = data['second_industry'] y3 = data['third_industry'] plt.plot(x, y1, label='First Industry') plt.plot(x, y2, label='Second Industry') plt.plot(x, y3, label='Third Industry') plt.xlabel('Year') plt.ylabel('Employment Count') plt.title('Employment by Industry') plt.legend() plt.show() ``` 接下来我们将绘制饼图、柱形图和箱线图。饼图可以用于显示每个产业的占比情况,柱形图则可以用于比较每个产业就业人员数量的大小,而箱线图则能够展示这些数据的分布情况。代码如下: ```python # 饼图 labels = ['First Industry', 'Second Industry', 'Third Industry'] values = [data['first_industry'].sum(), data['second_industry'].sum(), data['third_industry'].sum()] plt.pie(values, labels=labels, autopct='%1.1f%%') # 柱形图 x_pos = np.arange(len(labels)) counts = [data['first_industry'].sum(), data['second_industry'].sum(), data['third_industry'].sum()] plt.bar(x_pos, counts, align='center') plt.xticks(x_pos, labels) plt.ylabel('Employment Count') plt.title('Employment by Industry') # 箱线图 data_to_plot = [data['first_industry'], data['second_industry'], data['third_industry']] plt.boxplot(data_to_plot) plt.xticks([1, 2, 3], labels) plt.show() ``` 通过上述代码,我们就可以很容易地绘制出折线图、散点图、饼形图、柱形图和箱线图。这些图表可以帮助我们更直观地了解就业人员数量的变化情况和每个产业之间的比较情况。希望本文能对Python初学者有所启发,让大家学会使用Matplotlib进行数据可视化。