”AI联合实验室“KOL影响力研究(上)

发布时间:2024-12-11 02:15

社媒时代,KOL对于品牌营销的重要性可以写几万字。但是,当重要性成为共识以后,就开始卷起来了。

过去,只有数据统计分析,对于KOL的品牌推广影响力预测确实有点不切实际。但当数据量足够大,并且遇到懂它的大数据处理技术,结合人工智能,KOL的品牌推广影响力确实可以通过科学的方法进行预测。

数说故事与香港城市大学共建的“AI联合实验室”(下面简称“AI联合实验室”),突破传统统计分析的能力边界,基于数说故事丰富海量的社媒数据,利用人工智能大数据挖掘分析、算法等技术,研究如何预测KOL品牌推广影响力。小红书和抖音的KOL影响力有什么显著的差异,又有哪些相同点?数说故事的商业专家和香港城市大学的研究人员针对KOL影响力预测,目前已经取得了第一阶段的研究成果。

研究说明:

“AI联合实验室”本次研究的样本由小红书和抖音接近6000个KOL账号超过20万条笔记视频组成。利用机器学习技术和算法模型,对两个平台中的KOL粉丝数、发文数、性别、所在城市级别、视频数、被收藏数,还有笔记和视频的相关数据,如评论数、点赞数、收藏数等进行研究。同时,“AI联合实验室”还会利用文本和视频分析技术,对每一条笔记及视频内容进行聚类分析。

- 小红书研究篇 -

使用KOL特征和历史互动数据

可预测未来发文互动量

基于目前的数据范围,直观假设如果一个KOL发文的互动量越大,该内容起到的影响就越大。所以,在研究中,“AI联合实验室”把KOL发文影响力列为Y值,并以KOL的特征数据与过往互动量作为因变量X,利用机器学习的方法,结合不同的算法模型,测试不同变量对于KOL发文互动量的预测准确度。因变量X_i由该KOL本身的特征指标,如粉丝数、发文数、视频数、被收藏数,抖音平台的性别、城市等数据,和第i篇之前的发文的互动数据(评论数、点赞数、收藏数)构成。“AI联合实验室”使用了简单的线性回归模型、随机回归树模型和梯度提升树XGBoost等来构建测试集和训练集。

研究变量一:KOL粉丝数

 KOL粉丝量?不用太care 

x1表示的是KOL粉丝量特征,该变量P值为0.358,表明它对因变量互动量的预测影响不显著,可以认为KOL粉丝量和其发文互动量关联不大。譬如,同一个KOL发文波动量是比较大,如下图的博主,互动量差异可达几十倍;同时,同一粉丝量等级的博主,互动量差异也可以非常大。但很多广告主,通常都会以粉丝量作为第一筛选项选择KOL,就会导致把很多优质的KOL被排除在候选清单内了。

▲  同一粉丝量等级的博主,互动量差异也可以非常大

研究变量二:发文类型

  小红薯们更喜欢与视频内容互动!  

我们把小红书的发文类型分为普通、视频、未知3个类别变量,根据回归模型中的回归系数判断其影响程度。结果显示(上图)视频笔记(x49)相对于普通笔记(x47),回归系数(蓝框)差异明显,且呈现正向影响,即视频笔记的互动量显著高于普通笔记。

  研究变量三:点赞、评论、收藏分析  

赞评藏,有“利”也有“弊”

使用线性回归的研究方法,我们将历史前5天的评论、点赞、收藏作为自变量,分析他们对于因变量第6天互动量的回归结果是否显著,以及观察系数来确定赞评藏的正负影响。通过模型输出的结果,我们发现不管正向或者负向,使用历史点赞、收藏、评论对未来互动量进行预测的效果是显著。从P值(右红框)可以看出,除了x6不显著,其余变量均显著。整体上点赞、评论数高而收藏数相对较低的发文互动量越高。观察回归系数(左红框),负向的变量(x3,x9,x12,x15)均表示的是历史收藏数。

KOL历史发文内容

预测未来发文互动量

除了KOL的特征数据和互动数据外,KOL的发文内容也是我们的重点研究对象。首先,我们会对KOL进行聚类,将自身特征相似的KOL放在一起分析内容,尽量减少不同群组KOL间的差异,排除其他因素的干扰。然后,从每类KOL的高互动内容中提取关键词及其重要性,使用关键词及其重要性预测互动量,寻找显著的关键词。最后按照品类、成分、内容形式等细分方面具体分析不同的关键词。

针对小红书平台,使用处理连续特征的KMeans聚类方法给KOL分组,剔除掉最后两类个数较少,不具备代表性的KOL类别,共有3类KOL,从分组统计的特征值来看,其刚好可以表示头、腰、尾三部分KOL。

使用什么方法对KOL发文内容进行分析,显得尤为重要!“AI联合实验室”使用了基于词频的TF-IDF技术,提取一个句子中的关键词并计算其重要性得分。

研究成果一

 不同类别的KOL,关键词重要性不一样 

“AI联合实验室”会利用算法抽取所有KOL发文的关键词,结合KOL的聚类结果,对KOL发文句子中关键词及其重要性得分提取后,会把KOL发帖内容中的关键词标记为特征向量X,去预测这些发帖最后的互动量y,并分析在这个过程中对预测起显著作用的维度及其对应的词语,这样就得到了对该类KOL而言,能提高发文互动量的相关词语。

在小红书的结果中,不同类别KOL发文主要的词语差异集中在品类和功效这两方面,如在品类方面,头部KOL的优势品类有乳膏、雨伞、甲胶油等,而腰部KOL的优势品类有茶包、短裙、化妆棉等,尾部KOL则擅长唇膜、唇纹方面的产品营销。

研究成果二

 不同类别的KOL关键词表现不一样的趋势

在平台方和营销节点的引导下,所有KOL呈现相同的场景变化趋势,但在同一时期,不同类型的KOL的高互动量关键词也表现出明显的差异。例如,在今年2月,如果从功效分类去看,“卸妆、美甲、保持身材、瘦身”等词可以为头部KOL带来更高的互动量;“淡化、磨皮、直发、变白”等词则为腰部KOL带来更高的互动量;“修容、卷发、显嫩、晕染、阴影”等词则为尾部KOL带来更高的互动量。

但如果从品类上看,同样也是2月的时间里,头部和腰部KOL的重要性关键词比较一致,对尾部KOL的互动量重要性更高的关键词与头部和腰部相比,差异就很大了。

网址:”AI联合实验室“KOL影响力研究(上) https://mxgxt.com/news/view/139516

相关内容

明星导演影响力与电影票房基于我国电影市场的实证研究(25页)
影视剧中吸烟形象对受众影响的实证研究
做客「娱情实验室」正片上线 谈到台词是需要不断研究、琢磨和练习的
明星丑闻对所代言品牌态度影响实证研究.doc
名人代言组合效应研究
《2024年 明星效应对大学生消费商品的影响研究》范文
娱乐明星偶像崇拜对青少年价值观的影响及对策研究.docx
2019年度明星消费影响力报告
流量明星”代言在品牌传播中的运用及其影响研究
品牌出海营销指南:如何与KOL网红合作

随便看看