面向新浪微博的用户画像研究.docx

上传人:一*** 文档编号:12770691 上传时间:2022-06-11 格式:DOCX 页数:50 大小:1.88MB
下载 相关 举报
面向新浪微博的用户画像研究.docx_第1页
第1页 / 共50页
面向新浪微博的用户画像研究.docx_第2页
第2页 / 共50页
面向新浪微博的用户画像研究.docx_第3页
第3页 / 共50页
面向新浪微博的用户画像研究.docx_第4页
第4页 / 共50页
面向新浪微博的用户画像研究.docx_第5页
第5页 / 共50页
点击查看更多>>
资源描述

面向新浪微博的用户画像研究计算机科学与技术 摘 要微博作为一种新型的短文本社交网络,已经成为了中国最大的微博社交网络平台并积累了大量的用户和影响力。微博发布门槛较低,文体个性随意随意,且内容形式丰富多样,因此携带有大量的用户特征信息。如何根据用户在社交网络上的行为信息以及其所发布内容推断用户的属性信息(即构建用户画像)对科学研究和商业应用都有着极高的价值。本文中,针对面向新浪微博的用户画像任务进行了以下两方面的研究:1. 用户数据的获取,预处理。文中首先探讨了一种分布式获取用户数据的方法并在新浪微博上获取了2万用户的相关数据。同时,本文探究了在微博语料上进行数据清洗的方法通过敏感词过滤、用户行为过滤、微博来源过滤等方法删除了无关的用户和部分用户微博;通过微博地理位置验证修正了未及时更改的地域属性信息。2. 用户特征表示对用户画像中不同属性分类结果的影响。本文将用户属性识别问题视为分类问题,在分类模型选择为逻辑回归的基础上,主要探究了用户的One-Hot表

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。