国开(北京开放大学)23春《Python程序设计》形考任务6【资料答案】

可做奥鹏全部院校在线离线作业毕业论文QQ:3230981406 微信:aopopenfd777

发布时间:2023-01-28 21:52:34来源:admin浏览: 0 次

考核目的

1.了解词云的制作过程和方法。

2.熟悉过程中用到的 pandas 操作方法。

考核内容

本实验需要对电影评论数据进行分析,这是一类文本型数据,与之前见到的数值型数据 有很大区别。中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础 模块,在进行中文自然语言处理时,通常需要先进行分词。本文选择使用 Python 中的 jieba 模块进行分词,然后导入停用词表,去除停用词(停用词及语句中无意义的词,如”的”,”了” 等)。本实验在接下来的步骤中进行了词频统计,然后利用词云这一直接的方式进行了展现。


考核要求

1.准备格式化数据。

2.通过案例掌握 Pandas 进行文本数据处理以及词云的可视化展现方法。

实验报告要求 

1.实验报告由实验目标、实验环境、实验内容、实验结果、实验体会五个方面构成。实验结果为实现代码和生成的页面截图。

2.实验报告以平台允许的格式上传。

3.实验报告由辅导教师评阅。




奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777

作业咨询 论文咨询
微信客服扫一扫

回到顶部