26.4月17日 期中考试复习—科目:数据分析基础
期中考试复习
科目:数据分析基础
考试、开卷、开网,考试时间 90 分钟。
环境说明:
使用环境需要已经安装了 mysql,vscode
环境准备:
- 使用 xshell 连接 ubuntu
- 使用 qzks 用户连接数据库,密码 123
- 创建 my_data 数据库
- 在 vscode 中建立“姓名+期中考试”文件夹,作为工作目录
题目 1:安装相关 python 库(5 分)
要求:安装以下 python 库:requests、openpyxl、numpy、pandas、matplotlib、pymysql、seaborn
项目一:北京菜品市场数据分析
题目 2.1 数据爬取(15 分)
要求:
- 在工作目录中建立“项目一:数据爬取. py”
- 爬取 http://www.xinfadi.com.cn/priceDetail.html 中的“水果”数据,要求日期选择为2024/04/01-2024/04/15。
- 将爬取结果打印至控制台
爬取成功 5 分,数据正确 10 分
题目 2.2 数据的 json解析(20 分)
要求:
- 在工作目录中建立“项目一: 数据的 json 解析. py”
- 将爬取到的数据进行解析,安装'菜名'(prodName), '类别'(prodCat), '均价'(avgPrice), '规格信息'(specInfo), '单位信息'(unitInfo), '更新时间'(pubDate)进行解析。
- 将解析后的数据输出到控制台。
- 将解析后的数据输出到 excel 并进行保存。
成功解析 5 分,解析正确10 分,输出 excel 5 分
题目 2.3 数据存入 mysql(15 分)
要求:
- 在工作目录中建立“项目一: 数据存入 mysql. py”
- 科学设计并在 kaoshi 库中创建 xfd_kaoshi 表。
- 将解析后的数据存储如 mysql 数据库。
- 导出 xfd_kaoshi. sql
创建数据表 5 分,存入数据库 5分,导出数据库 5 分
题目 2.4 绘制耙耙柑价格走势曲线图(10 分)
要求:
- 在工作目录中建立“项目一:绘制耙耙柑价格走势曲线图. py”
- 读取数据库,并绘制 2024/04/01-2024/04/15 价格走势曲线图。
- 并在图上进行合理标注。
画图 5 分,规范 5 分。
项目二:22303-22306 班成绩成绩分析
题目 3.1 数据爬取并存入数据库(15 分)
要求:
- 在工作目录中建立“项目二:数据爬取并存入数据库. py”
- 参照笔记代码
- 使用现场提供的 cookie 信息爬取各班期末考试成绩,注意修改 hosts 文件。
- 将结果存入 kaoshi 库中的 cj 表
爬取正确 5 分,解析争取 5 分,导入成功 5 分
题目 3.2 绘制 22306 班个人成绩雷达图(10 分)
要求:
- 在工作目录中建立“项目二:班个人成绩雷达图. py”
- 参考样张,绘制 22306 班每个人的成绩雷达图(语数英科目)
- 绘制相应的班级均分。
绘制个人 5 分,显示均分 5 分
题目 3.3 绘制 22306 班个人成绩分布图(10 分)
要求:
- 在工作目录中建立“项目二:个人成绩分布图. py”
- 参考样张,绘制 22306 班每个人语文成绩在年级中的分布图
本文是原创文章,采用 CC BY-NC-ND 4.0 协议,完整转载请注明来自 现代职校董良
评论
匿名评论
隐私政策
你无需删除空行,直接评论以获取最佳展示效果