22306班
未读
30.5月8日 项目:利用hanlp实现热门评论内容分词并绘制词云
本项目预期结果: 项目:利用hanlp实现热门评论内容分词并绘制词云 利用上节课简易的框架 import hanlp
tok = hanlp.load(hanlp.pretrained.tok.COARSE_ELECTRA_SMALL_ZH)
r=tok("你好,我是现代职业技术学校学生&quo
22306班
未读
29.5月8日 项目: 实现分词
分词 什么是分词 分词(Tokenization)是自然语言处理(NLP)中的一个基本步骤,它涉及将文本数据分解成更小的单元,通常是单词、短语或其他有意义的元素,这些单元被称作“词元”(tokens)。分词的目的是让计算机能够更好地理解和处理文本信息。以下是分词的一些关键点: 文本分解:将文本字符串
22306班
未读
28.5月6日 项目: 登录B站爬取推荐和评论
上一节课中,我们简单的介绍了selenium库的使用。 项目:爬取B站首页推荐内容 准备活动 from selenium import webdriver
from selenium.webdriver.common.by import By
import time
browser = webdri
22306班
未读
27.4月29日 项目: selenium库实现爬虫,爬B站
selenium库 Selenium是一个用于Web应用程序测试的工具。Selenium测试可以运行在多种浏览器上,包括但不限于Chrome、Firefox、Safari和Internet Explorer。 注意:selenium 库原本设计是应用在网页测试上的。 当下,各种网站的反爬虫手段愈发高
22306班
未读
26.4月17日 期中考试复习—科目:数据分析基础
期中考试复习 科目:数据分析基础 考试、开卷、开网,考试时间 90 分钟。 环境说明: 使用环境需要已经安装了 mysql,vscode 环境准备: 使用 xshell 连接 ubuntu 使用 qzks 用户连接数据库,密码 123 创建 my_data 数据库 在 vscode 中建立“姓名+期
22306班
未读
25.4月11日 期中考试复习—科目:大数据平台
期中考试复习 科目:Linux 操作系统 考查、开卷、开网,考试时间 90 分钟。 环境说明: 使用环境需要已经安装了 mysql、1 panel、DataEase. 确保 ubuntu 虚拟机内存为 3 G 环境准备: 使用 xshell 连接 ubuntu 使用 qzks 用户连接数据库 使用
22306班
未读
24.4月10日 期中考试复习—科目:Linux 操作系统
期中考试复习 科目:Linux 操作系统 考查、开卷、开网,考试时间 90 分钟。 环境说明: 使用初始的 Ubuntu 环境! 确保 ubuntu 虚拟机内存为 3 G 使用环境检查脚本,检查考试环境。 在 Ubuntu 中输入 curl -sSL http://10.86.12.48:8080/
22306班
未读
23.4月8日 项目:学生成绩分析—个人雷达图绘制
绘制学生个人成绩雷达图 绘制雷达图,能直观的反映学生语文数学成绩,并就 某次考试的成绩和平均成绩进行对比 期中、期末成绩进行对比展现进步退步情况 目标图 1. 准备工作(已经完成的可以忽略): 还原mysql数据库,为了统一进度。本次数据库,进行统一还原操作 方式可以通过: cj.sql phpad
22306班
未读
22.4月3日 项目:学生成绩分析—绘制学生成绩
绘制单学生成绩 每次考试后家长会上,班主任都需要向同学们出具成绩单。 本次任务我们绘制图表,让成绩能更直观的进行呈现。 通过循环将某班所有学生的图一次绘制出。 目标图 准备工作 准备好数据库 数据库中存在相应数据(看之前内容) 需要在原先代码上进行修改 步骤一:复制并修改原先代码 # 引入部分都要
22306班
未读
21.4月3日 项目:学生成绩分析—代码修正并优化使用体验
此部分是完成上节课留下的尾巴 上节课的基础 import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
import pymysql
impor