卓哥范文网 - 设为首页 - 加入收藏
当前位置 首页 > 专题范文 > 公文范文 >

第9章,,Python数据分析案例实战-影视作品分析

时间:2022-08-27 08:35:06 来源:网友投稿

下面是小编为大家整理的第9章,,Python数据分析案例实战-影视作品分析,供大家参考。

第9章,,Python数据分析案例实战-影视作品分析

 

 影视作品分析

 可以 选择电影

 1 需求分析 可以 通过数据分析电影

 2 通过 柱型- - 折线图显示城市评论数及平均分

 3 以 热力图显示评论的分布

 4 生成 评论内容的词云图

 5

 系统设计

 功能结构图

 业务流程图 用户 主窗体 选择电影 是否有分析图表 查

  看Y全国热力图主要城市评论数及平均分词

 云分

 析N

 系统预览

 系统开发必备

 

 第三方模块:

 PyQt5 、pyqt5-tools 、pyecharts 、echarts_china_cities_pypkg、 、echarts_china_provinces_pypkg 、echarts_countries_pypkg 、jieba 、wordcloud、 、pandas 、matplotlib 、imageio

 开发工具准备 

 操作系统:Windows 7 、

 Windows 10 。

 

 开发工具:PyCharm 

 内置模块:os 、sys 、json 、urllib.request 、collections 

 Python 版本:

 :Python3.7

 文件夹组织结构

 项目包 初始化文件 功能代码文件 窗体 UI文件 项目用图片

 技术准备

 j j ieba 模块(分词)

 1 wordcloud 模块(词云图)

 2

 什么是分词? 我来到北京清华

 我

 来到

 北京清华

 支持 三种分词模式(精确模式、全模式和 搜索引擎 模式 )

 1 jieba模块特点 支持 繁体分词

 2 支持 自定义词典

 3 采用 MIT (开源软件许可协议)授权协议

 4

 wordcloud 模块

 什么是词云图? 梦想 Python 创新 青春 Java Android 人生 苦短 我用Python 敬业 爱国 富强 民主 和谐

 参 参 数 名 称 说 说

 明 参 参 数 名 称 说 说

 明 font_path 指定使用的字体路径。如果词云文本中包括中文,则需要指定要使用的字体,否则中文将显示乱码 random_state 为每个词返回一个PIL 颜色 width 指定要生成的词云图的宽度,单位为像素,不需要指定单位。默认值为400 像素 background_color 指定背景颜色,默认为黑色 height 指定要生成的词云图的高度,单位为像素,不需要指定单位。默认值为200 像素 mode 指定颜色模式,默认为RGB margin 指定外边距,默认为2 像素 repeat 指定文本是否重复,默认为不重复,设置为True 表示重复 min_font_size 最小字号,默认为4 号字 max_words 指定最大词数,默认值为200 个 max_font_size 最大字号,默认为4 号字 mask 指定词云的形状。默认为长方形。如果想指定为其他形状需要使用imageio.imread() 解析一张图片,再将返回值设置为该参数的值。注意:设置mask 参数后,width 和height 两个参数则不起作用 WordCloud()

 主 窗体设计

 实现主窗体

 1 主窗体设计 查看部分的隐藏与显示

 2 下拉列表处理

 3

 实现主窗体

 实现的窗体

 业务流程

 查看部分 的隐藏与显示

 查看部分的显示与隐藏

 业务流程 开始显示查看内容应用:setVisible(True)方法结束隐藏查看内容应用 :setVisible(False) 方法

 下拉列表处理

 下拉列表处理

 业务流程

 数据分析与处理

 获取数据

 1 数据分析与处理 生成全国热力图文件

 2 生成主要城市评论数及平均分文件

 3 生成云图图片

 4

 获取 数据

 业务流程 开始创建数据表应用:pandas模块解析数据应用:json模块添加数据到数据表应用:tomato.append()函数去掉数据表重复数据应用:tomato.append()函数更新数据表文件应用:tomato.to_excel()函数结束

 生成全国热力图文件

 业务流程 开始读取数据表文件内容应用:pandas模块生成热力图html文件应用:geo.render()函数结束

 生成主要城市评论数及平均分文件

 业务流程 开始数据排序获取内容应用:city_com.sort_values()函数生成评论数html文件应用:overlap.render()函数结束创建评论数及平均分图表(柱状图+折线图)应用:pyecharts模块

 生成词云图 图片

 业务流程 开始读取数据表评论内容应用:pandas模块评论内容分词处理应用:jieba模块生成云词应用:wordcloud模块生成云词图片应用:wc.to_file()函数结束

 点击查看显示内容

 创建显示 html 页面窗体

 1 点击查看显示内容 创建显示图片窗体

 2 绑定 查看按钮 单击事件

 3

 创建显示html 页面 窗体

 业务流程 开始创建窗体应用:自定义MainWindows类创建html显示控件应用:QWebEngineView控件显示html内容应用:自定义kk()函数结束

 创建显示图片窗体

 业务流程 开始创建窗体应用:自定义MainWindowy类创建图片显示控件应用:QLabel控件结束设置图片应用:browser.setPixmap()函数解析图片应用:QPixmap()函数

 绑定查询 按钮 单击 事件

 业务流程 开始按钮绑定点击事件应用 :clicke.connect() 函数显示评论数应用:win.show()函数结束显示全国热力图应用:win.show()函数显示词云应用:winy.show()函数

推荐访问:基于python的数据分析案例 第9章 Python数据分析案例实战-影视作品分析 分析 影视作品 实战

Top