22306班
未读
37.5月29日 综合项目:爬取并分析知名B站UP主-2
火烧云数据-B站数据分析平台-B站营销增长 (hsydata.com) 没时间,未完成,需修改 以下代码跑不了 只是关键点参考 import pandas as pd
from collections import Counter
import ast
import matplotlib.pyplo
22306班
未读
36.5月22日 综合项目:爬取并分析知名B站UP主-1
综合项目:爬取并分析知名B站UP主-1 本项目为综合项目,本课内容主要实现: 对某up主的所有视频数据进行爬取 得到链接、标题、观看数量、点赞数、投币数、标签、封面图 存储到csv文件供后续分析 基本框架 本次以“百大UP”小约翰可汗的视频为例:https://space.bilibili.com/
22306班
未读
35.5月21日 项目:DrissionPage爬取图片网站
项目:DrissionPage爬取图片网站 我们之后的项目需要用到爬取图片,下载视频,下载文档等功能。 我们通过这个项目,简单介绍下如何使用DrissionPage的下载功能。 本次使用的网站是: 引入库 from DrissionPage import WebPage
22306班
未读
类似案例:DrissionPage实现爬取51job
类似案例:DrissionPage实现爬取51job 逻辑与之前项目相似,不再赘述。 以下是基础代码框架
from DrissionPage import WebPage
from DrissionPage import ChromiumOptions
import time
path = r'
22306班
未读
32.5月15日 项目:使用DrissionPage爬取Boss直聘
本项目预期结果: 使用DrissionPage爬取Boss直聘 之前库的缺点和局限性 requests库 requests库效率很高,但有明显缺点: 需要手动处理heads和cookies 难以应对各个网站的反爬机制 获取网页元素的