付费玩家与非付费玩家的分类模型训练

付费玩家与非付费玩家的分类模型训练

作者:news 发表时间:2025-08-04
AI重塑商业竞争格局:大摩揭示五大投资机遇 Adobe(ADBE.US)、亚马逊(AMZN.US)获重点推荐又一个里程碑 中信建投:连涨之后的回调,市场预期的变与不变 电解铝行业深度:成本下行盈利修复,紧平衡格局延续 家电行业:品控下降背后意味着什么?是真的? 国家发展改革委:设立政府投资基金不以招商引资为目的,鼓励降低或取消返投比例反转来了 中油工程锁定伊拉克180亿大单,中东市场战略再落关键一子 黄金交易提醒:非农“崩盘”+关税风暴,金价暴涨逾2%创一周新高!多头瞄准3400 黄金交易提醒:非农“崩盘”+关税风暴,金价暴涨逾2%创一周新高!多头瞄准3400这么做真的好么? 从“集体躺赚”到“精英游戏” 公募打新策略“豹变” 崔东树:反内卷持续推进 1-6月汽车行业利润率4.8%有所改善后续反转 大禹节水成功举办“RWA时代高端农产品创新研讨会”并签订重要战略合作协议后续来了 财经早报:特朗普再批劳工统计局前局长制造“骗局”,下半年央行降准降息均有空间后续会怎么发展 巴西总统卢拉称若获得平等对待 愿意与美国进行贸易谈判记者时时跟进 8月4日财经早餐:非农爆冷,金价创一周新高,OPEC+达成增产协议,全球原油供应格局生变 长城灵魂摩托车将入驻上海博物馆,魏建军发文致谢 金价技术面等待确认“黄金交叉”!黄金酝酿下一波爆发 秒懂 “稳增长”与“防风险”并重 央行明确下半年七方面工作重点官方已经证实 期卷“V型”翻红!焦煤涨超2%!钢价能否止跌企稳?官方通报 分析:美联储面临的政治压力再增 或有助欧元/美元进一步走高实时报道 【盘中播报】28只股长线走稳 站上年线实垂了 特朗普解雇劳工统计局局长引爆舆论时间脉络全梳理! 新浪财经APP第一时间捕捉并解读分析 利德曼连收3个涨停板实时报道 对标Figma 万兴科技孵化Pixso已获中金鑫智百度风投深高新投复星创富等投资 八种资金支持!上海浦东推进标杆性金融科技集聚区建设最新报道 券商CFO盘点:南京证券财务总监刘宁薪酬92万元,比行业平均低30万反转来了 2025年《财富》世界500强榜单公布:海尔智家再次上榜,排名提升17位!这么做真的好么? 星展:料龙国平安上半年新业务价值增长强劲 目标69港元 重申“买入”评级 星展:料龙国平安上半年新业务价值增长强劲 目标69港元 重申“买入”评级官方已经证实 长城灵魂摩托车将入驻上海博物馆,魏建军发文致谢实垂了 日本农林龙国金库CEO承诺在美债投资亏损约120亿美元后将更加谨慎 上市以来最高大涨869%!北交所7只新股首日涨幅超150% 000652为什么要改名?——泰达股份的绿色跃迁之路这么做真的好么? 官宣!80后前海航系CFO执掌某上市公司! 7月十大牛股出炉:上纬新材逾1083%涨幅问鼎榜首 后续来了 吉利银河 E5 纯电 SUV 上市 1 周年,累计销量突破 16 万辆 突然火了!商业航天企业,密集闯关A股IPO!是真的? 磷酸铁锂压实密度提升的三大技术破局路径 特朗普要在白宫建宴会厅,被批:DOGE就是砍掉民众利益,送钱给总统嘛学习了 鸿蒙智行智界双 7 新车全系标配 192 线激光雷达 + 4D 毫米波雷达,R7 车型 8 月 8 日开启小订 特朗普:佩洛西是靠内幕信息发家的,她应该受到调查专家已经证实 协同推动机器人科技创新与产业发展,2025世界机器人大会新闻发布会在京召开后续会怎么发展 连年巨亏冲科创板,蓝箭航天成色如何?官方处理结果 宗庆后遗产纠纷案香港高院裁决全文实时报道 国恩股份 :拟布局PEEK材料,大化工业务持续进击 呆芒华为Mate 70手机壳 百亿补贴价26.41元 日本农林龙国金库CEO承诺在美债投资亏损约120亿美元后将更加谨慎 华金证券:A股已开启全面慢牛趋势 调整是逢低布局机会官方处理结果 磷酸铁锂压实密度提升的三大技术破局路径

  文/青果灵动公司AlphaGame组 马恒  研究目的:游戏玩家分两类:付费玩家和免费玩家,他们在游戏内的行为上存在一定差异。本研究针对一款成功手机网游《狂暴之翼》,使用支持向量机(SVM)训练了一个分类器,能自动识别一个玩家属于付费玩家的概率。本研究使用的数据是该手游的埋点数据,采用了4个显著特征作为输入维度。最终分类正确率达到81%。  分类器的应用:应用本分类器,可以识别游戏开服后具有潜在付费倾向的免费玩家,项目组有针对性地对这些玩家进行个性化服务(例如打折,特殊活动等),促进免费玩家向付费玩家的转变,从而提升游戏付费率和总体收益。对于有付费倾向但暂时没有付费的玩家,我们做两点假设:  1、他对这款游戏感兴趣,以至于产生了付费玩家的特征。  2、游戏中的商品(钻石,月卡等)价格高于他的心里预期。  在这个假设基础上,我们对这个玩家进行商品打折,或是低价销售,可以有效地促进破冰(玩家进行第一笔消费)。  一、玩家特征提取  我们从《狂暴之翼》埋点数据中,选取4个统计特征对玩家数据进行数据挖掘,然后训练分类器。这4个特征数据如下:  a、玩家开服当天到达的最高等级;  b、玩家的总点击次数;  c、玩家点击游戏按键的频率;  d、玩家开服当天游戏的总时间。

付费玩家与非付费玩家的分类模型训练

玩家特征数据示意图

  对开服当天付费玩家和同样数量的非付费玩家进行上述数据统计,加一维付费/非付费标签属性,付费玩家标记为1,非付费玩家标记为0。  选取这四维属性的原因如下:  假设一个玩家付费,那么玩家等级在第一天应该会达到一个比较高的级别,同时他的在线时间也会较长;点击次数代表一个玩家的疲劳值,点击次数多,玩游戏越易产生疲劳,说明玩家对游戏的喜欢,更有可能成为付费玩家;点击频率太快,说明对游戏没认真的体验,点击频率太慢,说明挂机时间长,付费玩家的点击频率应该在一个合理的值附近波动。  在处理过程中,我们还有一个假设:玩家所在的地域影响玩家付费意愿和付费能力。考虑到人均收入越高的地区,付费玩家应该会越多,我们根据玩家的登录ip获取玩家的地区,根据2015年31个省的人均收入,对玩家进行了偏序度量,划分为了6个等级,如北京、上海、江苏省的度量为6,西藏,青海等省度量为1。按此方式为每个玩家增加了一维地区属性。  二、分类模型训练  我们定义的四个维度,都是连续的数值属性,并假设我们的玩家数据是线性可分的,所以我们选取了SVM(支持向量机)进行模型训练。  支持向量机,因其英文名为support vector machine,一般简称SVM,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略是通过间隔最大化,最终转化为一个凸二次规划问题的求解。  具体过程如下:随机选取了《狂暴之翼》三十个服的埋点数据,每个服随机选取与付费玩家等量的非付费玩家。然后利用SVM进行模型训练,最后得到一个玩家付费与非付费的分类器。由于每个服的数据量不同,为了保证数据不受服务器的影响,统计好玩家的特征之后,把玩家特征数据合并之后,再随机打乱分成2等份。其中,一份数据用做训练,另一份数据用来测试,测试分类器的准确度。  三、结果分析  分类器的量化评价标准是分类准确度,其定义如下:

付费玩家与非付费玩家的分类模型训练

  其中,A表示被分类器正确分类的玩家数,B表示被分类器错误分类的玩家数,A与B的和,表示玩家总数。  从实际意义上来讲,80%准确度表示,对100个游戏玩家进行付费和非付费判断,分类器会把其中80个玩家正确的分为是否付费玩家,把20个玩家错误的分类。当分类器把一个玩家分到付费玩家中,说明这个玩家的特征符合付费玩家的特征,相比于其他非付费玩家更有可能通过我们的努力(促销,激励),转化为付费玩家。  图1为训练数据中不包含玩家地区属性,训练出的分类器对应的分类正确度。图2为训练数据中包含玩家地区属性,训练出的分类器对应的分类正确度。横坐标表示训练的数据量的大小,从5到30分别表示用了几个服的数据。纵坐标表示进行100次试验的准确度平均值。可以看出随着训练数据量的增大,模型的准确度会逐渐提高,然后稳定下来。同时测试的准确度也随着训练数据量的增大,逐渐提升,最后稳定在0.81附近。  在测试中我们发现:玩家的地区属性对分类器基本没影响。分析原因:付费玩家与非付费玩家在地区分布上的差异度很小。图3为付费玩家与非付费玩家的地区分布图,0代表非付费玩家,1代表付费玩家。随机选取与付费玩家等量的非付费玩家数。由于是随机选取,样本在一定程度上是可以代表整体的。从图中可以看出在样本中,虽然发达地区,付费玩家远多于欠发达地区,但是非付费玩家的地区分布与付费玩家地区分布基本相同,导致地域属性在分类中无显著区分能力。

付费玩家与非付费玩家的分类模型训练

  图1训练数据中没有地区属性的分类器准确度变化曲线

付费玩家与非付费玩家的分类模型训练

图2训练数据中加入地区属性的分类器准确度变化曲线

付费玩家与非付费玩家的分类模型训练

图3付费玩家与非付费玩家的地区分布图

  总结  本次研究得到的分类器的预测准确度有待提高。研究中,刻画玩家的维度较少,提取的某些特征区分付费与非付费玩家的作用有限。我们下一步工作有两点,一是对分类器进行一些应用,二是增加玩家的特征属性,发现更有价值的特征。  差异化服务一直以来都是商业竞争的核心,游戏业也如此。本文采用机器学习手段实现的用户分类器,可以使我们发现不同用户的需求,方便我们提供差异化的服务,从而提高产品盈利能力。

相关文章