1、浅谈组合数学,南开大学 组合数学中心 陈永川 2004年7月,组合数学概述,现代数学可以分为两大类:一类是研究连续对象的,如分析、方程等;另一类就是研究离散对象的组合数学。 计算机出现以后,由于离散对象的处理是计算机科学的核心,研究离散对象的组合数学得到迅猛发展。,组合数学概述,吴文俊院士指出,每个时代都有它特殊的要求,使得数学出现一个新的面貌,产生一些新的数学分支,组合数学这个新的分支也是在时代的要求下产生的。最近,吴文俊院士又指出,信息技术很可能会给数学本身带来一场根本性的变革,而组合数学则将显示出它的重要作用。 Gian-Carlo Rota教授曾提出要向中国领导人呼吁,组合数学是计算机
2、软件产业的基础,中国最终一定能成为一个软件大国,但是要实现这个目标的一个突破点就是发展组合数学。,组合数学的历史,传说在公元前23世纪大禹治水的时候,在黄河支流洛水中,浮现出一个 大乌龟,甲上背有9种花点的图案,人们将图案中的花点数了一下,竞惊奇地发现9种花点数正巧是19这9个数,各数位置的排列也相当奇妙,横的3行、纵的3列以及两对角线上各自的数字之和都为15。,上图为三阶洛书,幻方问题,组合数学中有许多象幻方这样精巧的结构。1977年美国旅行者1号、2号宇宙飞船就带上了幻方以作为人类智慧的信号。, 阶 幻 方,阿基米德手稿,上图为一份用希腊文写在羊皮纸上的阿基米德手稿副本, 最近科学家借助现
3、代科技手段初步破译了古希腊数学家阿基米德的这篇论文, 结论是这篇被称作Stomachion的论文解决的是组合数学问题。,阿基米德手稿,在论文中阿基米德是在计算把14条不规则的纸带拼成正方形一共能有多少种不同的拼法。这在现在被称为tiling问题。当今数学家借助计算机得出的答案是17152种拼法,这在当时是相当困难的。,Periodic Tilings,Non-Periodic Tilings,Penrose Tilings,Symmetric Tilings,Symmetric Tilings,贾宪三角,中国最早的组合数学理论可追溯到宋朝时期的”贾宪三角”, 后来被杨辉引用, 所以普遍称之为”
4、杨辉三角”, 这在西方是1654年由帕斯卡提出,但比中国晚了400多年。,11,11,2,11,3,3,11,4,6,4,11,5,10,10,5,11,6,15,20,15,6,1,七桥问题,近代图论的历史可追溯到18世纪的七桥问题穿过Knigsberg城的七座桥,要求每座桥通过一次且仅通过一次。Euler1736年证明了不可能存在这样的路线。,Euler 定理,如果一个图包含一条经过每条边恰好一次的闭途径,则称这个图为欧拉图。对任意的非空连通图,若它是欧拉的, 当且仅当它没有奇度点。,Knigsberg桥对应的图,36 军官问题 (欧拉 1779) The Great Frederic的阅
5、兵难题-欧拉的困惑 拉丁方阵:,正交拉丁方阵:,Euler 猜想,不存在6阶正交拉丁方不存在4k+2阶正交拉丁方 现在的结论对任正整数 n2,6, 存在 n 阶正交拉丁方,组合数学的应用,组合数学的应用,著名的组合数学家 Thomas Tutte 在组合数学界是泰斗级的大师。直到最近人们才知道,原来他对提前结束“二战”有着突出贡献。Tutte 从德军的两条情报密码出发,用组合数学的方法,重建了敌人的密码机,确定了德军密码的内部结构,从而获得了极为重要的情报。,组合数学的应用,在美国有一家公司用组合数学的方法来提高企业管理的效益,这家公司办得非常成功。在美国已有专门的公司用组合设计的方法开发软件
6、,来解决工业界中的试验设计问题。德国一位著名组合数学家利用组合数学方法研究药物结构,为制药公司节省了大量的费用,引起了制药业的关注。,四色问题,在日常生活中我们常常可以遇到组合数学的问题。比如一个著名的世界难题“四色猜想” :一张地图,用一种颜色对一个地区着色,那么一共只需要四种颜色就能保证每两个相邻的地区颜色不同。,四色问题,1852年,刚从伦敦大学毕业的Francis Guthrie提出了四色猜想。1878年著名的英国数学家Cayley向数学界征求解答。此后数学家 Heawood 花费了毕生的精力致力于四色研究,于1890年证明了五色定理(每个平面图都是5顶点可着色的)。直到1976年6月
7、,美国数学家 K. Appel与 W. Haken,在3台不同的电子计算机上,用了1200小时,才终于完成了“四色猜想”的证明,从而使四色猜想成为了四色定理。,中国邮递员问题,1962年中国组合数学家管梅谷教授提出了著名的“中国邮递员问题”。一个邮递员从邮局出发,要走完他所管辖的每一条街道,然后返回邮局。那么如何选择一条尽可能短的路线。,中国邮递员问题,这个问题可以转化为:给定一个具有非负权的赋权图G, (1)用添加重复边的方法求G的一个Euler赋权母图G*,使得 尽可能小。 (2)求G*的Euler 环游。 这个问题可以由Fleury算法和1973年著名组合数学家J. Edmonds和Jo
8、hnson 给出的一个好的算法解决。,货郎担问题,一个货郎要去若干城镇卖货,然后回到出发地,给定各城镇之间所需的旅行时间后,应怎样计划他的路线,使他能去每个城镇恰好一次而且总时间最短?,货郎担问题,用图论的术语说,就是在一个赋权完全图中,找出一个具有最小权的Hamilton 圈(包含图G的每个顶点的圈)。这个问题目前还没有有效的算法。Hamilton问题是图论的一个重要问题,图论中的许多问题,包括四色问题、图的因子问题,最终都与Hamilton问题有关。,相识问题,1958年,美国的数学月刊上登载着这样一个有趣的问题:“任何6个人的聚会,其中总会有3个人相互认识,或3个人相互不认识”。用6个顶
9、点表示6个人,用红色连线表示两者相识,用蓝色连线表示两者不相识。于是问题化为下述命题:,相识问题,对6个顶点的完全图K6任意进行红、蓝两边着色,则图中一定存在一个同色三角形。,Ramsey数,推广为一般问题:给定任意正整数a和b,总存在一个最小整数 r(a,b),使得r(a,b) 个人中或者有 a 个人互相认识,或者有 b 个人互相不认识。称 r(a,b) 为Ramsey数。,Erds -Szekeres 定理,Ramsey定理是由Erds和Szekeres于1935年提出的。它是下述定理的一个推广:定理(Erds和Szekeres) :若 a, b N,n=ab+1,且x1, , xn是任一
10、n个实数的序列,则这个序列包含一个有a+1项的单调递增(递减)的子序列,或一个有b+1项的单调递减(递增)的子序列。,Happy End 问题,对于n3,处于平面上一般位置(任意三个顶点不共线)的g(n)个顶点中,一定有n个顶点组成一个凸n边形。 5顶点一定含有一个凸四边形Erdos 和 Szekeres (1935) 证明了 g(n) 一定存在,并且有,5个顶点时的情形,机器证明吴消元法,1976年吴文俊教授开始进行研究几何定理的机器证明,并在很短的时间内取得重大突破。他的基本思想如下:引进坐标,将几何定理用代数方程组的形式表达;提出一套完整可行的符号解法,将此代数方程组求解。此两步中,一般
11、第二步更为困难。,机器证明吴消元法,周咸青利用并发展吴方法,编制出计算机软件,证明了500多条有相当难度的几何定理,并在美国出版了几何定理机器证明的专著。吴方法不仅可证明已有的几何定理,而且可以自动发现新的定理。可以从Kerler定律推导牛顿定律;解决一些非线性规划问题;给出Puma型机器人的逆运动方程的解。吴文俊教授还将其方法推广到微分几何定理的机器证明上。,网络流问题,随着中国经济快速的增长,城市化是未来中国的发展方向。人大通过的“十五”规划,把物流业作为战略重点列入要大力发展的新兴服务产业。如何制定一个运输计划使生产地到销售地的产品输送量最大。这就是一个网络最大流问题。,网络流问题,19
12、56年Ford 和Fulkerson 提出了关于网络流问题的一个重要定理。最大流最小割定理:在任何网络中,最大流的值等于最小割的容量。由这个定理可以引出求网络最大流的一个算法标号法。1970年,Edmonds和Karp 对标号程序加以改进,使之成为一个好的算法。,稳定的婚姻问题,组合数学中有一个著名定理:如果一个村子里每一个女孩都恰好认识k个男孩,并且每一个男孩也恰好认识k个女孩,那么每一个女孩都可以嫁给她认识的一个男孩,并且每一个男孩都可以娶一个他认识的女孩。( k 正则二部图,一定存在一个完美匹配),稳定的婚姻问题,但是这样的安排方法不一定是最好的。假如能找到两对夫妇,彼此都更喜欢对方的配
13、偶,那么这样婚姻有潜在的不稳定性。用图论匹配理论中Gale-Shapley算法,可以找到一种婚姻的安排方法,使得没有上述的不稳定情况出现。,稳定的婚姻问题,这种组合数学的方法有 一个实际的用途:美国的医院在确定录取住院医生时,他们将考虑申请者的志愿的先后次序,同时也给申请者排序。按这样的 次序考虑出的总的方案将没有医院和申请者两者同时后悔的情况。 实际上,高考学生的最后录取方案也可以用这种方法。,栈排序问题(Knuth, 1960s),模式: 对任意一个排列 , 最小的元素用代替,次小的元素用代替以此类推,这样得到的排列叫的模式。例如914的模式为:31237925 的模式为: 24513,栈
14、排序问题(Knuth, 1960s),避免排列:一个排列是避免的,当且仅当它的任意子序列中没有模式。例如 132564是避免 312的排列 146235是包含312的排列,栈排序问题(Knuth, 1960s),8,7,6,5,4,3,2,1,避免312排列,全一问题,假设博物馆里有若干个房间,每个房间里有一盏灯和一个开关,每次按下某个房间的开关,可以改变这个房间以及它相邻的房间的灯的状态。,全一问题,问是否可以找到一种开灯的方案,使得所有房间的灯由全亮变为全灭?这就是Sutner 于1989年提出的“全一问题”(All-Ones Problem)。,最小全一问题,求操作次数最少的解称为最小全
15、一问题。我们已经知道,对于一般图上的最小全一问题是NP完备的。陈永川教授与他人合作找到了一个线性时间算法,很好地解决了树和单圈图的最小全一问题。(SIAM Journal on Computing,2004),网络可靠性问题,一个通讯网络怎样布局稳定性最好,而且费用最节省?美国的贝尔实验室和IBM公司都有世界一流的组合数学家在研究这个问题,这个问题直接关系到巨大的经济利益。,最短网络问题,如何用最短的线路将三部电话连起来?此问题可抽象为设ABC为等边三角形,连接三顶点的路线(称为网络)。这种网络有许多个,其中最短路线者显然是二边之和(如ABAC)。,A,B,C,最短网络问题,但若增加一个周转站
16、(新点P),连接4点的新网络的最短路线为PAPBPC。最短新路径之长N比原来只连三点的最短路径O要短。这样得到的网络不仅比原来节省材料,而且稳定性也更好。,A,B,C,P,PollakGilbert猜想,由于最短网络在运输、通讯和计算机等现代经济与科技领域中都有重要的应用,对这个问题的研究也越来越深入。问题的对象已由三个点扩展到任意有限个点集。,PollakGilbert猜想,斯坦纳(Steiner)最小树是可以在给定的点之外再增加若干个点(称为斯坦纳点),然后将所有这些点连起来。如果不允许增加任何额外的点作为网络的顶点,这种最短网络称为最小生成树。在前面的例子中Steiner最小树的长为 而
17、最小生成树的长为2。,PollakGilbert猜想,1968年贝尔实验室数学中心主任波雷克(Pollak)和研究员吉尔伯特(Gilbert)提出如下猜想:平面上任意n点集,斯坦纳最小树长与最小生成树之长的比值的最小值是 。 这个猜想又被称为斯坦纳比猜想。,PollakGilbert猜想,PollakGilbert猜想起源于在美国贝尔电话公司发生的一个富有戏剧性的事件。1967年前,贝尔公司按照连结各分部的最小生成树的长度来收费。1967年一家航空公司戳了贝尔公司一个大洞。当时这家企业申请要求贝尔公司增加一些服务点,而这些服务点恰恰位于构造该公司各分部的斯坦纳最小树需增加的斯坦纳顶点上。这使得
18、贝尔公司不仅要拉新线,增加服务网点,而且还要减少收费。这一意外事件迫使贝尔公司自此以后便采用了斯坦纳最小树原则 。,PollakGilbert猜想,1990年,中科院应用数学所研究员堵丁柱与美籍华人黄光明合作,证明了PollakGilbert猜想。在美国离散数学界引起轰动,被列为19891990年度美国离散数学界与理论计算机科学界的两项重大成果之一。 在不列颠百科全书1992年鉴的数学评论中,该成果被列为世界上当年六项数学成果首项。该成果被我国列为1992年十大科技成就之一。,无尺度网络,20世纪20年代,由Karinthy提出。1950年, Pool 和 Kochen提出这样一个问题:“两个
19、毫无关系的人,要让他们互相认识,至少要经过多少人?”美国哈佛大学社会心理学家S. Milgram在1967年做过一项有趣的实验,据说他从内布拉斯加州的奥马哈随机选了300人,然后请他们每个人尝试寄一封信到波士顿的一位证券业务员。寄信的规则很简单,就是任何收信者只能把信寄给自己熟识的人。,重要结论,“6度分离” 对每个人来说,平均大约只需要通过个人就能将信寄到目的地。研究无尺度网络,对于防备黑客攻击、防治流行病、和开发新药等,都具有重要的意义。在1999年,Barabasi et al.发现在因特网上,任意两个网页间的链接最多为19次。(Nature 401, 1999),无尺度网络的一个例子,
20、因特网是一个无尺度网络,左图的星爆形结构描绘了从某一测试站点到其他约十万个站点的最短连结路径。图中以相同的颜色来表示相类似的站点。,Szemerdi 定理,若 k 为一个正整数并且0,则存在一个正整数 N = N(k,) ,使得集合1,2,N的每一个N 长的子集都包含 k 长的等差级数。N(k,) 有一个很有名的界,Szemerdi 定理,其中下界是由Behrend(对k=3的情形)和Rankin 给出的,上界是由W.Timothy Gowers 给出的。 Gowers因为给出了这个上界而获得了1998年的Fields奖。,生物数学,目前,计算生物学、基因理论、生物信息学都是最前沿的研究领域。
21、随着人类基因组计划的完成和其他基因计划的完成,所有公认的和潜在的蛋白质元都可以被确定,通过大规模的实验技术,可以生成大量的生物学数据。,生物数学,如何处理这些数据来获得生物学的信息,这里组合数学和随机图论都起到了关键的作用。如果将基因看作网络中的顶点,将他们之间的作用看作网络中的边,那么每一次大规模实验将给我们带来关于基因交互作用网络的一些信息。这个网络的拓扑性质是科学家们关心的焦点(如每一个顶点的度和网络中的最小距离问题是两个初步的问题)。,生物信息学,组合数学和概率统计在生物信息学中有重要应用。美国科学院院士Michael Waterman教授,曾鼓励我们借助组合数学的优势,开展生物信息学的研究。天津大学张春霆院士和北京师范大学王梓坤院士,北京大学钱敏平教授,南开大学沈世镒教授,,谢 谢 !,