第9章,,Python数据分析案例实战-影视作品分析
下面是小编为大家整理的第9章,,Python数据分析案例实战-影视作品分析,供大家参考。
影视作品分析
可以 选择电影
1 需求分析 可以 通过数据分析电影
2 通过 柱型- - 折线图显示城市评论数及平均分
3 以 热力图显示评论的分布
4 生成 评论内容的词云图
5
系统设计
功能结构图
业务流程图 用户 主窗体 选择电影 是否有分析图表 查
看Y全国热力图主要城市评论数及平均分词
云分
析N
系统预览
系统开发必备
第三方模块:
PyQt5 、pyqt5-tools 、pyecharts 、echarts_china_cities_pypkg、 、echarts_china_provinces_pypkg 、echarts_countries_pypkg 、jieba 、wordcloud、 、pandas 、matplotlib 、imageio
开发工具准备
操作系统:Windows 7 、
Windows 10 。
开发工具:PyCharm
内置模块:os 、sys 、json 、urllib.request 、collections
Python 版本:
:Python3.7
文件夹组织结构
项目包 初始化文件 功能代码文件 窗体 UI文件 项目用图片
技术准备
j j ieba 模块(分词)
1 wordcloud 模块(词云图)
2
什么是分词? 我来到北京清华
我
来到
北京清华
支持 三种分词模式(精确模式、全模式和 搜索引擎 模式 )
1 jieba模块特点 支持 繁体分词
2 支持 自定义词典
3 采用 MIT (开源软件许可协议)授权协议
4
wordcloud 模块
什么是词云图? 梦想 Python 创新 青春 Java Android 人生 苦短 我用Python 敬业 爱国 富强 民主 和谐
参 参 数 名 称 说 说
明 参 参 数 名 称 说 说
明 font_path 指定使用的字体路径。如果词云文本中包括中文,则需要指定要使用的字体,否则中文将显示乱码 random_state 为每个词返回一个PIL 颜色 width 指定要生成的词云图的宽度,单位为像素,不需要指定单位。默认值为400 像素 background_color 指定背景颜色,默认为黑色 height 指定要生成的词云图的高度,单位为像素,不需要指定单位。默认值为200 像素 mode 指定颜色模式,默认为RGB margin 指定外边距,默认为2 像素 repeat 指定文本是否重复,默认为不重复,设置为True 表示重复 min_font_size 最小字号,默认为4 号字 max_words 指定最大词数,默认值为200 个 max_font_size 最大字号,默认为4 号字 mask 指定词云的形状。默认为长方形。如果想指定为其他形状需要使用imageio.imread() 解析一张图片,再将返回值设置为该参数的值。注意:设置mask 参数后,width 和height 两个参数则不起作用 WordCloud()
主 窗体设计
实现主窗体
1 主窗体设计 查看部分的隐藏与显示
2 下拉列表处理
3
实现主窗体
实现的窗体
业务流程
查看部分 的隐藏与显示
查看部分的显示与隐藏
业务流程 开始显示查看内容应用:setVisible(True)方法结束隐藏查看内容应用 :setVisible(False) 方法
下拉列表处理
下拉列表处理
业务流程
数据分析与处理
获取数据
1 数据分析与处理 生成全国热力图文件
2 生成主要城市评论数及平均分文件
3 生成云图图片
4
获取 数据
业务流程 开始创建数据表应用:pandas模块解析数据应用:json模块添加数据到数据表应用:tomato.append()函数去掉数据表重复数据应用:tomato.append()函数更新数据表文件应用:tomato.to_excel()函数结束
生成全国热力图文件
业务流程 开始读取数据表文件内容应用:pandas模块生成热力图html文件应用:geo.render()函数结束
生成主要城市评论数及平均分文件
业务流程 开始数据排序获取内容应用:city_com.sort_values()函数生成评论数html文件应用:overlap.render()函数结束创建评论数及平均分图表(柱状图+折线图)应用:pyecharts模块
生成词云图 图片
业务流程 开始读取数据表评论内容应用:pandas模块评论内容分词处理应用:jieba模块生成云词应用:wordcloud模块生成云词图片应用:wc.to_file()函数结束
点击查看显示内容
创建显示 html 页面窗体
1 点击查看显示内容 创建显示图片窗体
2 绑定 查看按钮 单击事件
3
创建显示html 页面 窗体
业务流程 开始创建窗体应用:自定义MainWindows类创建html显示控件应用:QWebEngineView控件显示html内容应用:自定义kk()函数结束
创建显示图片窗体
业务流程 开始创建窗体应用:自定义MainWindowy类创建图片显示控件应用:QLabel控件结束设置图片应用:browser.setPixmap()函数解析图片应用:QPixmap()函数
绑定查询 按钮 单击 事件
业务流程 开始按钮绑定点击事件应用 :clicke.connect() 函数显示评论数应用:win.show()函数结束显示全国热力图应用:win.show()函数显示词云应用:winy.show()函数
热门文章:
- 最新文明礼貌月活动策划,文明礼貌月活动方案(优秀1合集)(全文完整)2024-08-22
- 2023年医院护士面试自我介绍(优秀17篇)2024-08-22
- 2023年最新六年级自我介绍(汇总18篇)2024-08-22
- 学生会个人简历如何写(优秀9篇)2024-08-22
- 2023四年级学生自我介绍,四年级学生自我介绍(大全8篇)(全文完整)2024-08-22
- 房屋租赁合同书样本,房屋租赁合同书(优质11篇)【精选推荐】2024-08-22
- 设备租赁合同(通用12篇)2024-08-22
- 最新转让协议书才有法律效力(大全10篇)(全文完整)2024-08-22
- 2023海边捡垃圾社会实践报告,垃圾处理社会实践报告(优秀8篇)(范文推荐)2024-08-22
- 最新外科护士自我鉴定(实用18篇)2024-08-22