2023(春)Python程序设计作业5:Pandas基础技能及综合应用

软工224-635-刘俊 2023-春-学生 2023-06-13 18:16:49

实验一:Series对象的应用

实验要求:

  • 定义一个Series对象,包含5个整数数据;
  • 访问、修改Series对象中的数据;
  • 打印Series对象;
  • 对Series对象进行计算,如求和、求平均值等。

代码实现:

import pandas as pd

# 创建一个Series对象
s = pd.Series([1, 3, 5, 7, 9])

# 访问Series对象中的数据
print(s[0])  

# 修改Series对象中的数据
s[0] = 2
print(s) 

# 打印Series对象
print(s)

# 对Series对象进行计算,如求和、求平均值
print(s.sum())  
print(s.mean())  

运行结果:

      


实验二:DataFrame对象的应用

实验要求:

  • 定义一个DataFrame对象,包含3个列,每列分别为整数、浮点数和字符串类型;
  • 访问、修改DataFrame对象中的数据;
  • 对DataFrame对象进行计算,如求和、求平均值等。

代码实现:

import pandas as pd

# 创建一个DataFrame对象
data = {
    '整数': [1, 2, 3, 4],
    '浮点数': [1.5, 2.5, 3.5, 4.5],
    '字符串': ['a', 'b', 'c', 'd']
}
df = pd.DataFrame(data)

# 访问数据
print(df.loc[0, '整数']) 

# 修改数据
df.loc[0, '整数'] = 5
print(df)    

# 对DataFrame对象进行求和、求平均值
print(df.sum())  
print(df.mean()) 

运行结果: 

     


实验三:综合实例

实验要求:

  • 定义一个包含省会城市、人口、GDP、城市面积的DataFrame对象;
  • 计算各种排名,如人口最多的城市、GDP最高的城市等;
  • 使用Pandas绘图,可视化上述实验结果。

代码实现:

import pandas as pd
import matplotlib.pyplot as plt

# 创建一个DataFrame对象
data = {
    '城市': ['北京', '上海', '广州', '深圳', '杭州'],
    '人口': [2154, 2424, 1523, 1252, 981],
    'GDP': [30320, 32680, 21000, 22300, 14900],
    '面积': [16410, 6340, 7435, 1996, 1689]
}
df = pd.DataFrame(data)

# 计算各种排名
max_population = df['人口'].max()
max_gdp = df['GDP'].max()

city_with_max_population = df.loc[df['人口'] == max_population, '城市'].iloc[0]
city_with_max_gdp = df.loc[df['GDP'] == max_gdp, '城市'].iloc[0]

print(f"人口最多的城市是 {city_with_max_population},人口为 {max_population}")
print(f"GDP最高的城市是 {city_with_max_gdp},GDP为 {max_gdp}")

# 使用Pandas绘图
df.set_index('城市', inplace=True)
df.plot(kind='bar', subplots=True, layout=(2,2), figsize=(8,6))
plt.show()

运行结果:

          

 

...全文
16 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

163

社区成员

发帖
与我相关
我的任务
社区描述
软件工程老师
python 高校 江苏省·南通市
社区管理员
  • juking@ntu
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧