期中考试复习

科目:数据分析基础

考试、开卷、开网,考试时间 90 分钟。

环境说明:
使用环境需要已经安装了 mysql,vscode

环境准备:

  1. 使用 xshell 连接 ubuntu
  2. 使用 qzks 用户连接数据库,密码 123
  3. 创建 my_data 数据库
  4. 在 vscode 中建立“姓名+期中考试”文件夹,作为工作目录

题目 1:安装相关 python 库(5 分)

要求:安装以下 python 库:requests、openpyxl、numpy、pandas、matplotlib、pymysql、seaborn


项目一:北京菜品市场数据分析

题目 2.1 数据爬取(15 分)

要求:

  1. 在工作目录中建立“项目一:数据爬取. py”
  2. 爬取 http://www.xinfadi.com.cn/priceDetail.html 中的“水果”数据,要求日期选择为2024/04/01-2024/04/15。
  3. 将爬取结果打印至控制台
    爬取成功 5 分,数据正确 10 分

题目 2.2 数据的 json解析(20 分)

要求:

  1. 在工作目录中建立“项目一: 数据的 json 解析. py”
  2. 将爬取到的数据进行解析,安装'菜名'(prodName), '类别'(prodCat), '均价'(avgPrice), '规格信息'(specInfo), '单位信息'(unitInfo), '更新时间'(pubDate)进行解析。
  3. 将解析后的数据输出到控制台。
  4. 将解析后的数据输出到 excel 并进行保存。
    成功解析 5 分,解析正确10 分,输出 excel 5 分

题目 2.3 数据存入 mysql(15 分)

要求:

  1. 在工作目录中建立“项目一: 数据存入 mysql. py”
  2. 科学设计并在 kaoshi 库中创建 xfd_kaoshi 表。
  3. 将解析后的数据存储如 mysql 数据库。
  4. 导出 xfd_kaoshi. sql
    创建数据表 5 分,存入数据库 5分,导出数据库 5 分

题目 2.4 绘制耙耙柑价格走势曲线图(10 分)

要求:

  1. 在工作目录中建立“项目一:绘制耙耙柑价格走势曲线图. py”
  2. 读取数据库,并绘制 2024/04/01-2024/04/15 价格走势曲线图。
  3. 并在图上进行合理标注。
    画图 5 分,规范 5 分。

项目二:22303-22306 班成绩成绩分析

题目 3.1 数据爬取并存入数据库(15 分)

要求:

  1. 在工作目录中建立“项目二:数据爬取并存入数据库. py”
  2. 参照笔记代码
  3. 使用现场提供的 cookie 信息爬取各班期末考试成绩,注意修改 hosts 文件。
  4. 将结果存入 kaoshi 库中的 cj 表
    爬取正确 5 分,解析争取 5 分,导入成功 5 分

题目 3.2 绘制 22306 班个人成绩雷达图(10 分)

要求:

  1. 在工作目录中建立“项目二:班个人成绩雷达图. py”
  2. 参考样张,绘制 22306 班每个人的成绩雷达图(语数英科目)
  3. 绘制相应的班级均分。
    绘制个人 5 分,显示均分 5 分

题目 3.3 绘制 22306 班个人成绩分布图(10 分)

要求:

  1. 在工作目录中建立“项目二:个人成绩分布图. py”
  2. 参考样张,绘制 22306 班每个人语文成绩在年级中的分布图