标签: jieba | 现代董良

互动

最近评论

标签

寻找感兴趣的领域

文章

cisco 9 ubuntu 2 机器学习 3 yolo 4 标注 5 centos 19 23306 7 flask 1 DrissionPage 5 wordcloud 4 hanlp 2 jieba 2 selenium 2 da-shu-ju 0 DataEase 1 docker 1 nginx 1 linux 6 DataFrame 8 pandas 7 matplotlib 11 numpy 1 数据分析 15 1panel 4 mysql 6 python 32 excel 1 json 3 爬虫 13 软件环境 1 大数据 43 22036 46 Halo 0

31.5月9日临时使用jieba版

22306班未读

31.5月9日临时使用jieba版

本项目预期结果：步骤一：导入评论数据在5月6日课程中，我们已经获取了B站视频的前200条热门评论。我们利用之前课程结果“B站评论.json”。我们首先实现读取json文件内容： import json with open('B站评论.json', 'r', encoding='utf-8')

jieba 大数据 22036 python matplotlib wordcloud 2024-05-08

29.5月8日项目：实现分词

22306班未读

29.5月8日项目：实现分词

分词什么是分词分词（Tokenization）是自然语言处理（NLP）中的一个基本步骤，它涉及将文本数据分解成更小的单元，通常是单词、短语或其他有意义的元素，这些单元被称作“词元”（tokens）。分词的目的是让计算机能够更好地理解和处理文本信息。以下是分词的一些关键点：文本分解：将文本字符串

jieba hanlp 大数据 22036 python 2024-05-06

最近发布

9. 子网掩码划分 2025-06-03 09:11:18

12. 复习题 2025-05-28 09:09:39

8. OSPF 动态路由协议 2025-05-13 09:56:38

11. MYSQL数据库 2025-05-12 13:03:03