20231407陈原 2024-2 python程序设计实验四《python综合实践》实验报告

20231407陈原 2024-05-29 22:36:22

实验内容

Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。
课代表和各小组负责人收集作业(源代码、视频、综合实践报告)

例如:编写从社交网络爬取数据,实现可视化舆情监控或者情感分析。

例如:利用公开数据集,开展图像分类、恶意软件检测等

例如:利用Python库,基于OCR技术实现自动化提取图片中数据,并填入excel中。

例如:爬取天气数据,实现自动化微信提醒

例如:利用爬虫,实现自动化下载网站视频、文件等。

例如:编写小游戏:坦克大战、贪吃蛇、扫雷等等

注:在Windows/Linux系统上使用VIM、PDB、IDLE、Pycharm等工具编程实现。

程序代码

img

img

img

img

import matplotlib.pyplot as plt
import seaborn as sns


def create_csv(file_path):
    data = {
        'date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
        'product': ['Product A', 'Product B', 'Product A', 'Product B'],
        'sales': [30, 20, 25, 30],
        'revenue': [300, 200, 250, 300]
    }

    df = pd.DataFrame(data)

    df.to_csv(file_path, index=False)
    print("CSV file created successfully.")

def read_data(file_path):
    try:
        data = pd.read_csv(file_path)
        print("Data loaded successfully.")
        return data
    except FileNotFoundError:
        print("File not found.")
        return None

def clean_data(data):
    data = data.drop_duplicates()

    data = data.dropna()

    data['date'] = pd.to_datetime(data['date'])

    print("Data cleaned successfully.")
    return data


def analyze_data(data):
    total_revenue = data['revenue'].sum()
    print(f"Total Revenue: {total_revenue}")

    revenue_per_product = data.groupby('product')['revenue'].sum()
    print("Revenue per product:")
    print(revenue_per_product)

    daily_sales = data.groupby('date')['sales'].sum()

    return total_revenue, revenue_per_product, daily_sales

def visualize_data(revenue_per_product, daily_sales):
    plt.figure(figsize=(10, 5))

    plt.subplot(1, 2, 1)
    revenue_per_product.plot(kind='bar')
    plt.title('Revenue per Product')
    plt.xlabel('Product')
    plt.ylabel('Revenue')

    plt.subplot(1, 2, 2)
    daily_sales.plot(kind='line')
    plt.title('Daily Sales Trend')
    plt.xlabel('Date')
    plt.ylabel('Total Sales')

    plt.tight_layout()
    plt.show()
def main():
    file_path = 'sales_data.csv'

    create_csv(file_path)

    data = read_data(file_path)

    if data is not None:
        data = clean_data(data)

        total_revenue, revenue_per_product, daily_sales = analyze_data(data)

        visualize_data(revenue_per_product, daily_sales)


if __name__ == "__main__":
    main()

运行结果

Total Revenue: 1050
Revenue per product:
product
Product A    550
Product B    500
Name: revenue, dtype: int64

心得感受

数据分析是现代商业和研究的重要工具,Python作为一种强大且灵活的编程语言,已经成为数据分析领域的首选。
Python拥有丰富的库,可以帮助我们高效地进行数据处理、分析和可视化工作。在本次数据分析程序中,我主要使用了 pandas、matplotlib 和 seaborn 这三个库。
这个python程序综合了我所学到的知识,对我来说是一个很大的挑战。但它让我回顾了我所学到的知识 ,让我的编程能力得到了巨大的进步

...全文
166 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

110

社区成员

发帖
与我相关
我的任务
社区描述
人生苦短,我用Python!
python3.11 高校
社区管理员
  • blackwall0321
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧