用户行为分析与数据挖掘模型研究与应用.ppt

上传人:99****p 文档编号:1420648 上传时间:2019-02-25 格式:PPT 页数:42 大小:2.98MB
下载 相关 举报
用户行为分析与数据挖掘模型研究与应用.ppt_第1页
第1页 / 共42页
用户行为分析与数据挖掘模型研究与应用.ppt_第2页
第2页 / 共42页
用户行为分析与数据挖掘模型研究与应用.ppt_第3页
第3页 / 共42页
用户行为分析与数据挖掘模型研究与应用.ppt_第4页
第4页 / 共42页
用户行为分析与数据挖掘模型研究与应用.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、Market StrategyUE Design User BehaviorL用户行为分析与数据挖掘模型研究与应用2013-03-26产业市场研究所介绍框架2用户群体个体属性(职业 /性别 /收入等)社会属性(家庭 /团队等 )个体偏好(阅读 /视频 /音乐等)群体相似性(协同 /关联等 )产业市场研究所n用户个体属性判别模型n用户社交属性判别模型n用户的业务偏好分析模型n基于群体相似性的智能推荐模型目录3产业市场研究所总体框架4用户属性训练数据新用户数据模型训练用户调研特征向量用户基础画像数据关联二级划分用户属性数据处理、变换一级划分数据处理、变换训练 应用产业市场研究所模型描述(一级)n

2、从 GPRS数据流量的角度划分n 数据总量:约 5.5亿,抽样数据:约 100万,抽样率: 1.82用户低流量用户 中流量用户 高流量用户低流量客户 中流量客户 高流量客户月 GPRS流量 0, 1M) 1M, 30M (30M, +) 抽样客户数 393677 329375 276948抽样客户占比 39.37% 32.94% 27.69%5产业市场研究所模型描述(二级)n 根据客户个人属性划分: 6大属性, 37( 26)个标签n 属性不可直接获取 抽取部分客户做调研 关联调研数据与基础画像数据,为每一维度每一类别建立 类中心向量模型属性 性别 年龄 地域 学历 职业 收入标签数 2 8(

3、4) 2 5 14(7) 66回收 9749/发送 92万,回收率: 10.6 年龄 -中老年地域 -农村年龄 -青壮年职业 -学生性别 -男职业 -工人本地、漫游、GPRS *括号内为类别优化后的标签数产业市场研究所模型应用n 应用7第一级从 流量 的角度划分第二级从 用户 的角度划分流量 30M用户群高流量用户低流量用户学历 -初中及以下地域 -农村年龄 -50岁以上地域 -城市手机号码 一级标签二级标签性别 年龄 地域 学历 职业 收入* 高流量 男 青壮年( 25-40岁 ) 城市大学本科 自由 职业 者 高于 9000元* 低流量 女 中老年及老年( 50岁 以上) 农 村初中及以下

4、 农 民 3001-5000元产业市场研究所用户属性及标签n 性别 男 女n 年龄 青少年( 13-24岁) 青壮年( 25-40岁) 中年( 41-50岁) 中老年及老年( 50岁以上)n 地域 城镇 农村n 职业 公务员 企业白领 工人 自由职业者 农民 学生 无业n 学历 初中及以下 高中 /中专 /技校 大专 大学本科 硕士及以上n 收入 低于 1500元 1501-3000元 3001-5000元 5001-7000元 7001-9000元 高于 9000元8产业市场研究所计算过程91、由于各数据字段单位、数量范围、表示含义不同,因此首先需要对语音、短信、上网、费用等做数据变换,对数

5、变换后归一化。每个用户形成一个 17维的向量,例如( 0.5236, 0.3067, , 0.8300)。2、将训练数据(调研数据及关联画像)近 1万个样本生成特征文件。特征文件中存储的是各二级维度下各标签代表类别的类中心向量。例如 “中流量男用户的类中心 ”:( 0.7429,0.4552, , 0.8322); “中流量女用户的类中心 ”:( 0.7651, 0.3464, , 0.8283)。3、对需要打标签的新数据做与第 1步相同的数据转换。例如某用户本地计费时长 90分钟,长途计费时长 1分钟 总费用 30元。经过数据转换后得到该用户的向量:( 0.7435, 0.5330, , 0.8300)。4、将每一个新用户转换后的数据与各二级维度下各标签的类中心对比,根据计算结果,将与用户距离近的类别标签赋予该用户。产业市场研究所介绍框架10用户群体个体属性(职业 /性别 /收入等)社会属性(家庭 /团队等 )个体偏好(阅读 /视频 /音乐等)群体相似性(协同 /关联等 )

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。