国开（北京开放大学）23春《Python程序设计》形考任务2【资料答案】-奥鹏学无忧教育辅导

考核目的

1．了解词云的制作过程和方法。

2．熟悉过程中用到的 pandas 操作方法。

考核内容

本实验需要对电影评论数据进行分析，这是一类文本型数据，与之前见到的数值型数据有很大区别。中文分词是中文文本处理的一个基础步骤，也是中文人机自然语言交互的基础模块，在进行中文自然语言处理时，通常需要先进行分词。本文选择使用 Python 中的 jieba 模块进行分词，然后导入停用词表，去除停用词（停用词及语句中无意义的词，如”的”,”了” 等）。本实验在接下来的步骤中进行了词频统计，然后利用词云这一直接的方式进行了展现。

考核要求

1．准备格式化数据。

2．通过案例掌握 Pandas 进行文本数据处理以及词云的可视化展现方法。

实验报告要求

1．实验报告由实验目标、实验环境、实验内容、实验结果、实验体会五个方面构成。实验结果为实现代码和生成的页面截图。

2．实验报告以平台允许的格式上传。

3．实验报告由辅导教师评阅。

奥鹏，国开，广开，电大在线，各省平台，新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777

微信客服扫一扫