1、 中国科学院 “百人计划 ”B 类 择优支持申请表 申请人姓名 尚明生 聘用单位 中国科学院 重庆绿色智能 技术 研究院 联系 电话 023-65936003 传 真 023-65935416 电子邮件 中国科学院人事局 姓名 尚明生 性别 男 出生年月 1973.07.27 专业 计算机应用 技术 研究领域 计算机 应用技术 聘任岗位 研究员 上岗时间 2015.05 学习经历 (从 本科 填起 ) 起始时间 终止时间 单位 学位 专业 2003.09 2007.12 电子科技大学 博士 计算机 应用技术 2000.09 2003.03 电子科技大学 硕士 计算机 软件与理论 1994.0
2、2 1995.07 电子科技大学 学士 计算机 科学 与技术 1991.09 1994.02 四川 师范学院 学士 数学 工作经历 (准确到月份) 起始时间 终止时间 单 位 研究领域 专业技术职 称 2010.08 至今 电子科技大学 数据挖掘 教授 /博导 2007.08 2010.07 电子科技大学 数据挖掘 副教授 2002.02 2007.07 电子科技大学 计算机 软件 讲师 1997.07 2002.01 四川 师范学院 计算机 应用 助教 2014.08 2015.01 瑞士 弗利堡大学 推荐系统 访问 学者 2011.08 2011.10 美国 罗切斯特大学 生物 统计 访问
3、 学者 2007.12 2009.01 美国 明尼苏达大学 推荐系统 访问 学者 如内容较多,本栏目填不下时,可另纸接续(以下各栏目均如此) 主要学术成就、科技成果及创新点 (简要概括,不超过 500 字) 主要成果包括: (1) 在信息推荐 领域 做出比较系统的工作 : 提出 推荐 系统信息核 的 概念和 信息核 提取 算法, 在 保证推荐质量的同时实现 基于 网络结构的大规模数据压缩 ; 提出长期有效的 推荐 算法研究 ,解决 现有算法 趋向 推荐流行项目 最终导致算法失效 的不足 ; 提出 推荐 系统从个性化算法 到 算法 个性化 的概念 和 算法 , 最大程度 地 提供个性化服务 ;
4、提出 协同 聚集系数指标,实现 可以 预先根据数据集 的 特征 来 离线 选择合适的推荐算法 ; 提出多个 基于 网络结构的 推荐算法,在准确性和多样性等指标 上 具有优势 。 不仅 提出 了 具体的 新 算法,而且 拓展 推荐系统新的研究方向。 (2) 在舆情 信息处理方面 : 提出 一种 高效的垃圾短信过滤方法,通过 对 发送者赋予不同 的抽样频率 并 结合 恰当 的多级文本 过滤 的层次组合, 实现 海量短信 实时监管; 设计 和实现了一 整套基于文本和结构分析的舆情信息收集、分析、预测的大规模 舆情 信息处理 方法 和系统。 (3) 针对 网格计算中任务的优化调度问题,提出了多个任务调
5、度算法 , 特别 是基于 一个合理 设计 的调度模型,给出 了 渐 优 的调度方案。 (4) 在 复杂网络 分析 方面,提出一种基于 社区 核的 重叠 社区 挖掘 算法;提出一种 基于 局域邻居的重要 节点 挖掘算法。 发表 SCI 检索论文 40 余篇, SCI 引用近 400 次, H 因子为 12, SCI 单篇论文引用最高 60 次,有 6 篇论文超过 20 次 。 主持国家自然科学基金项目 5 项,其中3 项为重大研究计划培育项目;参与国家自然基金重大项目和重点项目各 1 项 。申请国家发明专利 7 件,其中已授权 3 件 。 在科学出版社出版专著 2 部。获得中国计算机学会 201
6、4 年自然科学二等奖。 1-3 篇代表性论文(从事科研工作以来) 作者排序 题 目 期刊名称 年份、卷期 及页码 第一作者 Empirical analysis of web-based user-object bipartite networks EPL 2010, 90(4):48006 第一作者 Optimal algorithm for scheduling large divisible workload on heterogeneous system Applied Mathematical Modelling 2008,32(9):1682-1695 第一作者 对带误差项的广义集
7、值变分包含的近似点算法 数学学报 2001,44(4):753-760 近 5 年发表主要论文或 获批准 专利情况 作者排序 题 目 期刊或国际 会议名称 年份、卷期 及页码 第一作者 一种信息推送方法与装置 中国 发明专利 2012.10.17 授权 第一作者 Relevance is more significant than correlation: Information filtering on sparse data. EPL 2009,88(6):68008 第一作者 Empirical analysis of web-based user-object bipartite ne
8、tworks EPL 2010, 90(4):48006 第一作者 Collaborative filtering with diffusion-based similarity fusion on tripartite graphs Physica A 2010,389 :1259-1264 第一作者 Collaborative filtering based on multi-channel diffusion. Physica A 2009,388(23):4867-4871 第一作者 Diffusion-Based Recommendation in collaborative Tag
9、ging Systems Chin. Phys. Lett. 2009,26 (11): 118903 第一作者 Detecting overlapping communities based on community cores in complex networks Chin. Phys. Lett. 2010, 27(5): 058901 第一作者 Interest-driven model for Human Dynamics. Chin. Phys. Lett. 2010,27(4):048701 通信 作者 Auxiliary Domain Selection in Cross-D
10、omain Collaborative Filtering, Appl. Math. Info. Sci. 2015,9 (3): 1375-1381, 通信 作者 Recommendation algorithm based on item quality and user rating preferences Front. Comput. Sci. 2014 ,8(2):289-297 通信 作者 Similarity from Multi-Dimensional Scaling: Solving the Accuracy and Diversity Dilemma in Informat
11、ion Filtering PLoS ONE 2014,9 (10): e111005 通信 作者 Information Filtering in Sparse Online Systems: Recommendation via Semi-Local Diffusion, PLoS ONE 2013, 8(11): e79354 , 通信 作者 Extracting the Information Backbone in Online System PLoS ONE 2013, 8(5): e62624, 通信 作者 Preference of online users and perso
12、nalized recommendations. Physica A 2013,392(16): 34173423 通信 作者 Membership in social networks and the application in information filtering, , Eur. Phys. J. B. 2013, 86:375 通信 作者 Long-term Effect of Recommendation on the Evolution of Online Systems, Chin. Phys. Lett. 2013,30(11):118901, 通信 作者 Empiric
13、al Analysis on the Human Dynamics of a Large-Scale Short Message Communication System Chin. Phys. Lett. 2011, 28(6): 068901, 非 第一作者 A hybrid cognitive assessment based on ontology knowledge map and skills. Knowledge Based Systems 2015, 73: 52-60 非 第一作者 Uncovering the information core in recommender
14、systems Scientific reports 2014, 4: 6140 非 第一作者 Variability of contact process in complex networks Chaos 2011, 21: 043130 非 第一作者 An efficient heuristic algorithm for arbitrary shaped rectilinear block packing problem Computers & Operations Research 2010,37(6): 1068-1074 非 第一作者 The reinforcing influe
15、nce of recommendations on global diversification. EPL 2012,97(1):18005 非 第一作者 A fast and efficient heuristic algorithm for detecting community structures in complex networks Physica A 2009, 388(13): 2741- 2749 非 第一作者 Identifying influential nodes in complex networks. Physica A 2012,391:1777-1787 非 第
16、一作者 Detecting overlapping communities of weighted networks via local algorithm Physica A 2010,389(19): 4177-4187 非 第一作者 Emergence of local structures in complex network:common neighbor -hood drives the network evolution Acta Phys. Sin 2011,60(3): 038901 非 第一作者 Empirical study on Spatio-temporal evol
17、ution of online public opinion, Acta Phys. Sin. 2012, 61(9), 098901 非 第一作者 Can dissimiar users contribute to accuracy and diversity of perasonalized recommendation? IJMPC 2010,21(10): 1217-1227 非 第一作者 Similarity-based classification in partially labeled networks. IJMPC 2010,21(6): 813-824 近 5 年出版主要著
18、作情况 作者排序 书名 出版社及年份 撰写章节及 页码 第一作者 网络舆情信息处理技术 科学出版社 , 2015.02 第二 作者 网格高性能调度及资源管理技术 科学出版社 , 2010.05 注: “作者排序 ”栏按 “第一作者 ”、 “通信作者 ”、 “非第一作者 ”顺序填写 论文被收录情况统计(篇) 中国科学引文数据库 SCI EI 第一作者 8 通信作者 16 非第一作者 20 总 计 28 论文被引用情况统计( SCI 引用) 他人引用次数 引用期刊种数 引用作者人数 第一作者 54 21 202 通信作者 72 28 446 非第一作者 136 50 483 总 计 190 71
19、685 以上内容已经申请人确认,情况属实。 申请人签字: 2015 年 03 月 15 日 注: 1. “论文被收录和引用情况 ”只针对前面列出的代表性论文和近 5 年主要发表 的 论文进行统计; 2. 自引部分不计入引文统计中; 3. 对列入统计表中的论文需附论文首页复印件; 4. 对列入统计表中的论文 需提供 被引用情况 证明。 到位后已开展的工作 (包括研究内容与方向,实验室建设,团队建设等情况) 现阶段 已开展工作包括: ( 1) 积极参与和推动现有大数据商务智能相关研究,特别是 通过 参与国家自然基金重 大 项目 “大数据 环境下的商务管理研究 ”,以及 国家自然基金重点项目“大数据
20、 结构和关系简约计算方法 ”,谋划将 于下半年 启动 的重大研究 计划 项目。 ( 2) 调研 国家十三五规划相关精神, 积极谋划 已有 研究和 重庆 研究院 工作的结合,调研了解研究院 特别 是大数据中心 现状和既有项目开展情况, 特别 是三峡在线监测项目的进展情况 , 拟 重点 参与和推动该项目工作 , 并基于此项目, 凝聚 研究方向, 筹划 有 重庆研究院 特色的 研究 领域和方向 。 ( 3) 接触 和物色 相关 研究人员,筹划以各种可能方式尽快建设一支 有 较强实力的专兼职的研究队伍。 主持或参加项目的情况 项目名称 经费来源及额度 担任角色 动态演化在线系统中的信息推荐问题研究 国
21、家自然基金委 ,75 万 主持 社会网络的结构演化分析及其在舆情和疫情预警及控制中的应用 国家自然基金委 ,35 万 主持 基于复杂网络的信息推荐技术研究 国家自然基金委 ,30 万 主持 大规模信息传播和情感倾向的实证与分析 国家自然基金委 ,15 万 主持 社会网络分析及其上的传播动力学集成研究 国家自然基金委 ,15 万 主持 社会网络中的链路预测问题研究 中国 博士后科学基金 ,10 万 主持 基于社会网络的服务推荐技术研究 中国 博士后科学基金 ,3 万 主持 电子商务系统中的推荐技术研究和推荐引擎设计 四川省 科技厅 , 10 万 主持 On the diversity probl
22、em of recommender systems Sino Swiss Science and Technology Cooperation, 4 万 瑞郎 主持 Hybrid Algorithm for Information Filtering on User-Object Networks Sino Swiss Science and Technology Cooperation, 1 万 瑞郎 主持 Growth and innovation policy-modelling: applying next generation tools, data, and economic co
23、mplexity ideas 欧盟 第七框架项目 ,156.4205 万 欧元 主研 , 中方 排名 1 Non-Equilibrium Social Science in ICT and Economics 欧盟 第七框架项目 ,79.75 万欧元 主 研 初等数学问题求解关键技术及系统 863 计划 , 659 万 主研 ,排名4 Web 舆情的社会网络关系挖掘 863 计划 , 90 万 主研 ,排名2 海量短信流的智能监管及关键技术研究 863 计划 , 84 万 主研 ,排名2 大数据 环境下的商务管理研究 国家自然基金委 ,1800万 参与外协(清华大学 ) 大数据 结构与关系的发
24、现与简约 计算 方法 国家自然基金委 ,360万 主研 ,排名3 非常规突发事件下恐慌群体行为分析与疏导研究 国家自然基金委 ,160万 参与外协(中科大 ) 四川省 青年创新团队 四川省 科技厅 , 100 万 主研 ,排名3 基于 二维码 技术 的 固醇类 食品质量追溯应用研究及行业应用示范 四川省 科技厅 , 100 万 主研 ,排名2 垃圾短信监管基础软件平台 四川省 科技厅 , 20 万 主研 ,排名2 基于科学知识图谱分析的个性化文献推送系统 四川省 科技厅 , 30 万 主研 ,排名4 用人 单位提供的条件 (包括科研经费、实验用房、研究助手配备及研究生指标和住房等) 1. 一次
25、性支付方式提供 70 万元科研启动经费。 2. 提供 300M2办公和实验用房。 3. 配备固定人员 3 人;博士研究生 2 人、硕士研究生 1 人;流动人员 2 人。 4. 供住房 补贴 2.4 万元 /每年。 获资助后拟达到的总体目标与预期成果 (包括拟解决的科学问题、实验室环境、人才队伍建设和培养等) 1.拟解决的科学问题 推荐技术的研究在理论和应用层面都有着重大的意义和价值。 从理论上讲,信息推荐问题是信息挖掘与信息过滤这一重大科学问题的重要组成部分;从应用上讲,信息推荐技术已经成为绝大多数电子商务系统的核心技术,并创造了巨大的经济价值。更一般地,信息推荐问题还可视为不完备稀疏矩阵上的
26、重构问题,而矩阵重构问题是大多数科学和工程问题的共同基础。 信息推荐是一个典型的交叉研究领域,涉及信息科学、物理学、管理科学、运筹学等多门学科。最近几年,随着应用领域的迫切需求,以及新的理论、方法和工具的出现,信息推荐问题的研究达到了一个新的高潮。例如,物理学家提出基于复杂网络的方法,数学家提出基于信息论的方法,计算机科学家提出基于矩阵分解和各种邻接点选择的方法,来研究信息推荐问题。由于推荐问题本质上可以表示为二部图网络(后称推荐网络),而最近复杂网络的研究又提供了分析这类网络的比较先进和系统的理论方法,基于这些理论的推荐技术已经展示出一定优越性,因此本项目将主要集 中于基于网络分析的信息推荐
27、问题研究。 虽然基于网络分析的推荐问题研究已经得到很大的关注,并且取得了部分成果,但这些研究绝大部分都还是针对静态网络。事实上,推荐网络是动态演化发展的,而且用户的兴趣也可能发生漂移,因此,需要基于动态演化网络来研究信息推荐问题。另一方面,现有研究仅仅追求满足用户个体的单次预测,忽略算法对于推荐系统的长期影响,而实际运行的系统往往需要较长时期的调整以便提供更好的服务,这方面的研究目前还是空缺(注意到与传统的反馈机制是完全不同的)。此外,针对用户的个性化推荐算法需要在推荐系统的不同阶段采用不同的推荐算法。所有这些问题,都 涉及到动态演化的信息推荐系统。在我们的文献调研中,尚未发现关于推荐系统演化
28、方面的研究。至今为止,最相关的工作为把时间因素引入推荐算法来提高推荐的精确性。 本项目将集中于动态演化网络。首先研究推荐网络结构的参量及其变化对于推荐效果的影响,进而提出决定系统推荐效果的网络信息骨架问题。在此基础上,项目将克服现有研究中仅仅追求单次推荐效果的局限,重点研究推荐算法和推荐网络的长期协同演化。由于推荐系统中用户体验是最为重要的,项目还将研究网络演化过程中,用户推荐算法的最佳个性化使用。该个性化推荐算法和现有方法的不同在于 算法或者算法参数的个性化,而不是惯常的相同算法作用于不同数据集的个性化。最后,我们将基于演化网络来研究可能的产品流行趋势,在整体流行趋势的指导下,更好地设计个性
29、化推荐算法。 项目研究将不仅在理论上填补信息推荐系统的动态演化研究的空白,而且在实践中能提高推荐系统的长期效果及效率。通过研究,取得一批原创性成果,培养一批基础和应用方面 具有竞争力 的人才 队伍 。 2.研究内容 本项目使用二部图来刻画在线推荐系统,从网络演化分析入手,来研究系统动态发展过程中的信息推荐问题。首先,将系统研究网络结构对推荐效果的影响,提取决定推荐效果的网络信息骨架,并设计基于网络的动态调整方法来优化推荐过程。其次,将通过考察推荐系统和推荐网络的协同演化过程,设计具有长期优势的在线推荐算法,不仅满足个体需求,同时优化整个系统。第三,项目还将研究推荐算法的个性化使用问题,探究不同
30、算法的最适用用户群,为不同的用户及其在系统的不同阶段设计最恰当的推荐算法。最后,项目将研究演化推荐网络中的趋势预测问题,力求通过 微观的推荐过程来预测宏观的商品流行性演化。具体研究内容明确限定为如下各有侧重亦紧密联系的四个方面: ( 1)网络结构对推荐效果的影响及其动态调整 在大量围绕推荐系统的研究中,尽管研究者们普遍观察到同一个算法在不同网络中表现迥异,但大都把这种因素归结到数据集的稀疏程度。虽然在 2007 年研究者已经发现推荐系统的表现和底层网络的簇系数 (cluster coefficient)有一定的关系, 2010 年 我们 发现推荐系统指标和协同聚集系数相关,然而迄今这方面依然缺
31、乏系统性的研究。本项目将系统地研究并试图解决底层二 部图拓扑结构和推荐效果的对应关系问题。具体研究过程中,我们将构建推荐网络抽象模型,通过调节网络特征参数来提取影响推荐质量的因素,并详细研究各个因素的影响程度。模型探究结果将会在真实网络(如 Taobao, Movielens, Netflix, Delicious和 Amzon 等典型数据集)上验证。特别地,项目还将关注这些真实网络的演化,研究这些网络结构在不同时间的变化对推荐效果的影响。 在系统地研究了网络拓扑特征对推荐效果的影响以后,我们将设计网络结构的动态调节的方法来提高推荐算法的推荐效果。此外,对于小度商品 ,其连边数量少是导致推荐效
32、果差的根本原因。我们将研究为其增加可能虚拟连边的方法,来提升其推荐效果,解决冷启动问题;另一方面,我们已经发现在线系统中也存在部分冗余的、而且可能误导推荐算法的数据,据此我们提出推荐网络的“信息骨架” (information backbone) 概念,将研究如何准确定位并去除这些噪音信息,获得隔离噪音后仍保留推荐算法需要的大部分信息的网络结构。此外,由于在线网络是不断演化的,我们还需要研究随着网络结构的变化而动态调整的推荐算法,包括虚拟连边和网络信息骨架的动态变化和调整。 ( 2)推荐算法和在线系统的协同演化 现有网络推荐算法的研究都集中在静态网络,然而在线系统是一个不断演化发展的动态网络,因此在研究推荐算法的时候,需要考虑网络演化因素。此外,在加载了推荐系统的在线网络上,推荐系统和在线网络实际上是协同演化的:一方面,推荐系统会指导在线网络的演化;另一方面,在线网络的演化反过来又将影响推荐系统的推荐结果。这种影响在单次推荐中或许很小,但在连续的推荐过程中,将一步步放大,最终从宏观上体现出来。在实际应用中,一个优秀的推荐