一种基于大数据的影视作品市场分析方法与流程
技术特征:
1.一种基于大数据的影视作品市场分析方法,其特征在于包括如下步骤:
从社交网站获取数据;
进行K-Means聚类剔除异常数据;
剔除异常数据的数据,构建一个分析流,进行多次K-Means聚类和设置分箱节点对影片评分和观影人群进行分析后将数据存入目标文件。
2.根据权利要求1所述的一种基于大数据的影视作品市场分析系统,其特征在于, 在进行步骤从社交网站获取数据之前,定义需要的观影评论数据指标。
3.根据权利要求2所述的一种基于大数据的影视作品市场分析方法,其特征在于,所述数据指标包括影片评价得分均值,影片被网友评分次数,评分网友平均年龄,评分网友性别分布,评论该影片的网友的评分次数的均值,评价该影片的网友所有评分得分均值的均值。
4.根据权利要求3所述的一种基于大数据的影视作品市场分析方法,其特征在于, 从社交网站获取数据还包括利用python提取与设定数据指标匹配的字段,并存入ORACLE 数据库管理系统。
5.根据权利要求4所述的一种基于大数据的影视作品市场分析方法,其特征在于,步骤利用python提取与设定数据指标匹配的字段,并存入ORACLE 数据库管理系统还包括:将提取的与设定的数据指标匹配字段进行Z标准化,去除数据的单位限制,转化为无量纲的纯数值,并存入ORACLE 数据库管理系统。
6.根据权利要求5所述的一种基于大数据的影视作品市场分析方法,其特征在于, 进行K-Means聚类剔除异常数据包括:
剔除异常值,对数据进行一次K-Means聚类,评论该影片的网友的评分次数的均值过高或过低,且评价该影片的网友所有评分得分均值的均值过高或过低,判断评论该影片的用户多为异常用户,作为异常数据剔除。
7.根据权利要求6所述的一种基于大数据的影视作品市场分析方法,其特征在于,将剔除异常数据的数据构建一个分析流,用K-Means聚类算法或分层聚类演算法进行聚类处理,并设置分箱节点对数据按观影人群年龄和评分分级后将数据存入目标文件。
8.根据权利要求7所述的一种基于大数据的影视作品市场分析方法,其特征在于,所述分析流由节点组成,每个单独的节点就是一个函数或程序进行聚类分析。
9.根据权利要求8所述的一种基于大数据的影视作品市场分析方法,其特征在于, 该方法还包括使用分箱节点对离散型数据按其数值大小进行分段操作,对数据按观影人群年龄和评分分级,分析观影人群的年龄分布等信息指导影视作品投资决策。
网址:一种基于大数据的影视作品市场分析方法与流程 https://mxgxt.com/news/view/1206220
相关内容
一种基于追星族公会的大数据智能推荐系统及方法与流程一种基于AI大数据的艺人与产品资源精准对接系统及方法与流程
影视作品分析的基本方法
文本大数据分析 文本数据分析方法
数据分析的方法论
大数据影视营销分析
一种基于社交媒体平台数据的用户年龄标注方法与流程
大数据电影分析:数据可视化的力量
明星的数据分析方法是什么
数据分析和数据挖掘基本思路及手法