1、表示学习的理论、算法与应用专题探索班系列报告会通知时间:2019 年 1月 5日(星期六)上午 9:00-12:10地点:安徽大学磬苑校区图书馆文典阁一楼报告厅主办单位:CCF YOCSEF 合肥欢迎各位老师、同学届时前往!CCF YOCSEF 合肥专题探索班-表示学习的理论、算法与应用安徽大学磬苑校区图书馆文典阁一楼报告厅日期 时间 内容 执行主 席08:30-09:00 签到 09:00-09:10 开幕式 09:10-10:00题目:Broad Learning via Fusion of Heterogeneous Information for Recommendations特邀讲者
2、:Philip S. Yu,University of Illinois at Chicago10:00-10:30 茶歇 & 合影10:30-11:20题目:语言表示学习特邀讲者:陈恩红,中国科学技术大学11:20-12:10题目:异质信息网络的表示学习与应用特邀讲者:石川,北京邮电大学12:10-14:30 午餐 & Poster14:30-15:20题目:L21 范和迹范在稀疏编码和表示中的应用特邀讲者:丁宏强,安徽大学/德州大学阿灵顿分校15:20-15:40 茶歇15:40-16:30题目:知识表示与自然语言处理应用特邀讲者:刘知远,清华大学16:30-17:20题目:网络表示学习理
3、论及应用特邀讲者:唐杰,清华大学1 月 5日17:20-17:30 总结 & 闭幕式赵姝谢飞CCF YOCSEF专 题 探 索 班 Theme Discovery Symposium表 示 学 习 的 理 论 、 算 法 与 应 用 表 示 学 习 ( Representation Learning) 是 机 器 学 习 领 域 一 个 新 的 研 究 热 点 , 旨 在 将 原 始 数 据 表 示 成 低 维 、实 值 、 稠 密 的 向 量 形 式 , 使 得 得 到 的 向 量 形 式 可 以 在 向 量 空 间 中 具 有 表 示 以 及 推 理 的 能 力 , 同 时 可 轻 松 方
4、 便 地 作为 机 器 学 习 模 型 的 输 入 , 它 避 免 了 手 动 提 取 特 征 的 麻 烦 , 允 许 计 算 机 学 习 使 用 特 征 的 同 时 , 也 学 习 如 何 提 取 特 征 :学 习 如 何 学 习 。 近 年 来 , 以 深 度 学 习 为 代 表 的 表 示 学 习 技 术 受 到 广 泛 关 注 , 在 语 音 识 别 、 图 像 分 析 和 自 然 语 言 处理 等 领 域 取 得 重 要 研 究 进 展 。本 期 CCF YOCSEF 合 肥 将 举 办 TDS( Theme Discovery Symposium) 专 题 探 索 班 “表 示 学
5、 习 的 理 论 、 方 法及 应 用 ”, 有 幸 邀 请 到 机 器 学 习 领 域 重 量 级 的 专 家 学 者 做 主 题 报 告 , 就 表 示 学 习 理 论 最 新 的 研 究 成 果 和 应 用 进 行学 术 探 讨 , 具 体 围 绕 表 示 学 习 的 前 沿 探 讨 , 表 示 学 习 的 理 论 基 础 和 主 要 方 法 , 以 及 表 示 学 习 在 社 交 网 络 、 图 像 分析 、 自 然 语 言 处 理 等 领 域 的 应 用 展 开 讨 论 。 我 们 期 望 本 次 论 坛 能 够 有 效 推 动 机 器 学 习 和 表 示 学 习 理 论 、 技 术
6、 和 应用 的 发 展 , 增 进 领 域 学 者 间 的 交 流 与 互 动 , 使 参 加 者 在 掌 握 学 科 基 础 知 识 的 同 时 , 跟 踪 本 领 域 最 新 技 术 动 态 , 了解 未 来 技 术 发 展 趋 势 。 特邀讲者及讲者信息(按报告顺序) : 特邀讲者:Philip S. Yu (美国伊利诺伊大学芝加哥分校教授)简 介:Dr. Philip S. Yu is a Distinguished Professor and the Wexler Chair in Information Technology at the Department of Compute
7、r Science, University of Illinois at Chicago. Before joining UIC, he was at the IBM Watson Research Center, where he built a world-renowned data mining and database department. He is a Fellow of the ACM and IEEE. Dr. Yu is the recipient of ACM SIGKDD 2016 Innovation Award for his influential researc
8、h and scientific contributions on mining, fusion and anonymization of big data, the IEEE Computer Societys 2013 Technical Achievement Award for “pioneering and fundamentally innovative contributions to the scalable indexing, querying, searching, mining and anonymization of big data” and the Research
9、 Contributions Award from IEEE Intl. Conference on Data Mining (ICDM) in 2003 for his pioneering contributions to the field of data mining. Dr. Yu has published more than 1,100 referred conference and journal papers cited more than 102,000 times with an H-index of 148. He has applied for more than 3
10、00 patents.Dr. Yu was the Editor-in-Chiefs of ACM Transactions on Knowledge Discovery from Data (2011-2017) and IEEE Transactions on Knowledge and Data Engineering (2001-2004). 摘 要:In the era of big data, there are abundant of data available across many different data sources in various formats. “Br
11、oad Learning” is a new type of learning task, whichfocuses on fusing multiple large-scale information sources of diverse varieties together and carrying out synergistic representation learning and data mining tasks across these fused sources in one unified analytic. Great challenges exist on “Broad
12、Learning” for the effective fusion of relevant knowledge across different data sources, which depend upon not only the relatedness of these data sources, but also the target application problem. In this talk we examine how to fuse heterogeneous information to improve effectiveness on recommendation
13、systems.特邀讲者:陈恩红(中国科学技术大学教授)简 介 : 陈 恩 红 , 博 士 , 教 授 , 博 导 , 国 家 杰 出 青 年 基 金 获 得 者 , 科 技 部 重 点 领 域 创 新 团 队 负 责 人 , CCF 会士 。 1996 年 获 中 国 科 学 技 术 大 学 计 算 机 软 件 专 业 博 士 学 位 。 2005 年 入 选 教 育 部 新 世 纪 优 秀 人 才 支 持 计 划 、2015 年 获 安 徽 省 政 府 特 殊 津 贴 , 2016 年 入 选 安 徽 省 “特 支 计 划 ”创 新 领 军 人 才 。 现 任 中 国 科 学 技 术 大
14、学 计 算机 科 学 与 技 术 学 院 副 院 长 , 语 音 及 语 言 信 息 处 理 国 家 工 程 实 验 室 副 主 任 , 大 数 据 分 析 及 应 用 安 徽 省 重 点 实 验 室 主任 。 教 育 部 计 算 机 类 专 业 教 学 指 导 委 员 会 委 员 , 安 徽 省 计 算 机 学 会 理 事 长 , 中 国 计 算 机 学 会 理 事 、 人 工 智 能 与 模式 识 别 专 委 会 委 员 、 数 据 库 专 委 会 委 员 、 大 数 据 专 家 委 员 会 委 员 , 中 国 人 工 智 能 学 会 知 识 工 程 与 分 布 智 能 专 业 委员 会
15、副 主 任 委 员 、 机 器 学 习 专 委 会 常 务 委 员 。 曾 任 中 国 计 算 机 学 会 YOCSEF 合 肥 分 论 坛 首 任 主 席 ( 2011 年 )。 WWW Journal、 IEEE Transactions on System、 Man and Cybernetics: System, 计 算 机 研 究 与 发 展 、 模式识别与人工智能、计算机应用等国内外学术期刊编委,KDD、AAAI、ICDM、PAKDD、SDM 等重要国际学术会议的程序委员会委员,全国性学术会议 NDBC2012、CCDM2014、CNCC2015 等的程序委员会主席等。承担了国家自
16、然科学基金杰出青年基金项目、面上项目、联合重点基金项目,以及 863计划、国家重点研发计划课题等项目,以及与诺基亚、阿里巴巴、华为、讯飞的合作项目。在国内外重要学术期刊 TKDE、TKDD、TMC、TIST、TC 和数据挖掘领域重要国际学术会议KDD、WWW、SIGIR、ICDM、NIPS、ECML-PKDD、CIKM 等发表学术论文 100余篇,获数据挖掘领域顶级会议 KDD2008最佳应用论文奖、ICDM2011 最佳研究论文奖、SDM2015 最佳论文提名奖等,获 2012年度教育部自然科学二等奖,多次获得中科院优秀导师奖、中科院朱李月华优秀教师奖。指导的博士生获得中科院、中国计算机学会
17、、中国人工智能学会等的优秀博士论文奖,以及中科院院长中科院院长特别奖、优秀奖等。摘 要:近年来,以深度学习为代表的表示学习技术受到广泛关注,表示学习是通过机器学习将研究对象的语义信息表示为稠密低维实值向量。自然语言表示学习则通过词,短语以及句子的向量化语义表示进行表示学习。报告首先介绍语言表示学习的原理和基本方法。然后基于深度表示学习的背景,分析语言表示学习目前的研究进展。在此基础上,我们将进一步介绍表示学习在自然语言处理的具体应用,同时,系统介绍我们在语言表示学习方面,尤其是在多源信息表示的相关研究进展。最后,总结语言表示 学 习 目 前 面 临 的 主 要 挑 战 , 并 对 未 来 运
18、用 语 言 表 示 学 习 的 方 法 和 趋 势 进 行 展 望和 讨 论 。特邀讲者:石川(北京邮电大学教授)简 介:北京邮电大学计算机学院教授、博士研究生导师、智能通信软件与多媒体北京市重点实验室副主任。主要研究方向: 数据挖掘、机器学习、人工智能和演化计算。近五年来,作为第一作者或通信作者发表高水平学术论文 50余篇,英文专著一部,包括数据挖掘领域的顶级期刊和会议 IEEE TKDE、ACM TIST、KAIS、KDD、AAAI、IJCAI、SDM、CIKM 等。获得 ADMA2011/AMDA2018国际会议最佳论文奖、CCF-腾讯犀牛鸟基金及项目优秀奖,并指导学生获得顶尖国际数据挖
19、掘竞赛 IJCAI Contest 2015 全球冠军。获得北京市高等学校青年英才和师德先锋等称号。摘 要:当前的社会网络分析主要针对同质网络(即网络中结点类型相同),但是现实世界中的网络化数据通常包含不同类型的对象,并且对象之间的关联表示不同的语义关系。构建异质信息网络(即包含不同类型的结点或边的网络)可以包含更加完整的对象之间的关联信息,因此分析这类网络有希望挖掘更加准确的模式。本报告将介绍异质信息网络的基本概念和特点,以及异质网络的复杂结构和丰富语义对数据挖掘带来的挑战。此外,本报告将重点介绍异质网络结构特征的表示学习方法,及其在实际问题上的应用。特邀讲者:丁宏强(德州大学阿灵顿分校任终
20、身教授)简 介:丁宏强,在美国哥伦比亚大学李政道教授研究小组求学,获博士学位。长期工作于美国加州理工学院,喷气动力实验室,及劳伦斯-伯克利国家实验室。2007 年加入德州大学阿灵顿分校任终身教授。研究成果被 Science与 Nature杂志作为封面介绍和描述。他的研究领域包括数据挖掘,机器学习,信息检索,高性能计算等。从 2000 年开始,他和合作者创立了用矩阵模型作为中心理论和计算方法的子领域,研究 PCA和 K均值聚类的等价性;揭示了非负矩阵分解的聚类功能,导致了非负矩阵分解在无监督学习中的广泛应用;国际上第一次提出矩阵 L21范数的概念,现在 L21范数已经广泛应用在机器学习,模式识别
21、等领域中。他已发表 200余篇高水平论文,被引用 37000多次,他发表在 IEEE TPAMI上一篇特征选择的论文被引 6000多次,多年来长期高居 TPAMI最受欢迎(most popular)论文前十位以内。在 2018年 Top 1000 计算机科学家按 H指数排名,71 位华人学者上榜,丁宏强排名 30。摘 要:L21 范数,L12 范数,秩范数等理论现在广泛应用在机器学习,数据挖掘,人工智能领域中。我们先从概率选择推导出 LASSO模型,再系统性的介绍 L21范数、L12 范数等稀疏编码特征选择模型和应用,并详细讲解迹范数和Schatten-p范数在数据表示中的模型和应用。特邀讲者
22、:刘知远(清华大学副教授)简 介:刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011 年获得清华大学博士学位,已在 ACL、IJCAI、AAAI 等人工智能领域的著名国际期刊和会议发表相关论文 60余篇,Google Scholar统计引用超过 3600次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、中国计算机学会青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会秘书长,ACL、COLIN
23、G、IJCNLP 领域主席。摘 要:近年深度学习技术席卷自然语言处理(NLP)各大领域。作为典型的数据驱动方法,深度学习面临可解释性不强等难题,如何将人类积累的大量语言知识和世界知识引入深度学习模型,是 NLP深度学习模型的发展趋势,同时面临重要挑战。本报告将介绍知识指导的自然语言处理的最新进展与趋势。特邀讲者:唐杰(清华大学教授)简 介:清华大学计算机系长聘教授、计算机系副主任、清华-工程院知识智能联合实验室主任,获杰青。研究兴趣包括:社会网络分析、数据挖掘、机器学习和知识图谱。发表论文 200余篇,引用 11000多次(个人 h-指数 55)。主持研发了研究者社会网络挖掘系统 AMiner
24、,收录 1.36亿科研人员、2.31 亿科技文献,吸引了 220个国家/地区 800多万独立 IP访问。曾担任国际期刊 ACM TKDD的执行主编和国际会议 CIKM16、WSDM15 的程序委员会主席、KDD18 大会副主席以及 IEEE TKDE、ACM TIST、IEEE TBD 等期刊编委编委。荣获北京市科技进步一等奖、中国人工智能学会科技进步一等奖、KDD杰出贡献奖。摘 要:这个报告主要包括三个部分:面向网络的表示学习理论(WSDM18)、针对网络行为的端到端预测模型(KDD18)以及基于用户反馈的在线学习(NIPS18)。首先介绍我们在网络表示学习方面的理论分析通过理论分析将已有的几个网络表示学习做了归一化分析,并在此基础上提出基于矩阵分解的表示学习新方法;基于网络表示学习结果,我们进一步提出一种 Multi-Head的注意力模型实现了端到端的网络用户行为预测;最后通过用户反馈,实现用户行为预测的在线学习。