考核目的
1.了解词云的制作过程和方法。
2.熟悉过程中用到的 pandas 操作方法。
考核内容
本实验需要对电影评论数据进行分析,这是一类文本型数据,与之前见到的数值型数据 有很大区别。中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础 模块,在进行中文自然语言处理时,通常需要先进行分词。本文选择使用 Python 中的 jieba 模块进行分词,然后导入停用词表,去除停用词(停用词及语句中无意义的词,如”的”,”了” 等)。本实验在接下来的步骤中进行了词频统计,然后利用词云这一直接的方式进行了展现。
考核要求
1.准备格式化数据。
2.通过案例掌握 Pandas 进行文本数据处理以及词云的可视化展现方法。
实验报告要求
1.实验报告由实验目标、实验环境、实验内容、实验结果、实验体会五个方面构成。实验结果为实现代码和生成的页面截图。
2.实验报告以平台允许的格式上传。
3.实验报告由辅导教师评阅。
奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777