22306班
未读
14.3月18日 数据分析pandas—DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。 类似于excel表格了 DataFrame 特点: 列和行: DataFrame
22306班
未读
13.3月14日 数据分析pandas—Series
Pandas的数据结构 Pandas 提供了丰富的功能,包括: 数据清洗:处理缺失数据、重复数据等。 数据转换:改变数据的形状、结构或格式。 数据分析:进行统计分析、聚合、分组等。 数据可视化:通过整合 Matplotlib 和 Seaborn 等库,可以进行数据可视化 Pandas 应用 Pand
22306班
未读
12.3月14日 数据分析三剑客的使用—matplotlib-各种图
柱状图 案例: 利用柱状图,画各个水果的销售数据 fruits = ["苹果", "香蕉", "橘子", "葡萄", "西瓜"] sales = [80, 90, 70, 100, 60] import matplotlib.pyplot as plt
import numpy as np
plt.
22306班
未读
11.3月13日 数据分析三剑客的使用—matplotlib-曲线图
Matplotlib Matplotlib 是一个 Python 的绘图库,它可以用来创建各种静态、交互式和动态的数据可视化。Matplotlib 提供了一种类似于 MATLAB 的绘图接口,使得用户可以轻松地绘制图表、图形和各种可视化。 下面是 Matplotlib 的一些主要特点: 广泛的图表类
22306班
未读
10.3月11 数据分析三剑客的使用—numpy
数据分析三剑客 数据分析三剑客是指 NumPy、Pandas 和 Matplotlib 这三个 Python 库。它们是数据分析领域最常用的工具,可以满足大多数数据分析需求。 NumPy 是一个用于科学计算的 Python 库。它提供了一个强大的 n 维数组对象,并支持大量的数学函数。NumPy 非
22306班
未读
9.3月7日 阶段复习
ubuntu环境 注意虚拟机克隆到D盘 真机设置网卡 虚拟机设置网卡 安装ssh sudo apt install ssh 真机通过xshell连接虚拟机 后续操作通过xshell 进行 mysql数据库 5.2月28日 mysql环境部署 请创建数据库“my_db” 并创建表 班级 姓名 期中语文
22306班
未读
8.3月6日 项目:学生考试成绩—数据储存
上节课完成了对单个班级成绩的爬取,本次任务为爬取多个班级的期中期末成绩。 并存储到excel和数据库中。 为,下一次课的成绩分析做预备。 数据爬取 爬取多个班级 class_list=['22301','22302','22303','22304','22305','22306']
for cla
22306班
未读
7.3月4日 项目:学生考试成绩—爬取成绩
之前项目我们进行了简单的数据爬取,数据存储(json,excel,mysql),基本不涉及数据分析和数据处理 项目分析 本次项目,我们需完成我校学生期中期末考试成绩爬取。存储到我们本地数据库中,并对班级成绩,学生个人成绩进行分析。最终形成分析图表。 关于需要用户登录的网站的数据爬取: 网页请求是如何
22306班
未读
6.2月29日 项目:北京菜品市场数据存储(mysql数据库形式)
数据库创建和数据表创建 步骤1:登录后 创建数据库 登录 MySQL 控制台: sudo mysql -u xd -p
在 MySQL 控制台中,执行以下命令创建数据库my_db: CREATE DATABASE my_db;
USE my_db;
步骤2:创建数据表 CREATE
22306班
未读
4.2月26日 项目: 北京菜市场数据存储 (excel形式)
之前课程中我们将获取到的数据存储到了多个json文件中, 虽然完成了数据的存储,但数据分散,且不直观,也无法分析。 故本节课,将数据存储到excel中能更便于查看和分析。 本课使用数据集如下(就是上节课的代码下载的,只不过我下载的数据量比较大): 新发地34W条数据.zip openpyxl库的使用