1、 Web 开发技术发展史话讨论 Web 开发技术的历史,当然要先说说 Web 的起源。众所周知,Web 这个 Internet 上最热门的应用架构是由 Tim Berners-Lee 发明的。Web 的前身是 1980 年 Tim Berners-Lee 负责的 Enquire(Enquire Within Upon Everything 的简称)项目。1990 年 11 月,第一个 Web 服务器 nxoc01.cern.ch 开始运行,Tim Berners-Lee 在自己编写的图形化 Web 浏览器“WorldWideWeb“上看到了最早的 Web 页面。1991 年,CERN(Euro
2、pean Particle Physics Laboratory)正式发布了 Web 技术标准。目前,与 Web 相关的各种技术标准都由著名的 W3C 组织(World Wide Web Consortium)管理和维护。从技术层面看,Web 架构的精华有三处:用超文本技术( HTML)实现信息与信息的连接;用统一资源定位技术(URI)实现全球信息的精确定位;用新的应用层协议(HTTP)实现分布式的信息共享。这三个特点无一不与信息的分发、获取和利用有关。其实,Tim Berners-Lee 早就明确无误地告诉我们:“Web 是一个抽象的(假想的)信息空间。“ 也就是说,作为 Internet
3、上的一种应用架构,Web 的首要任务就是向人们提供信息和信息服务。很可惜,在 Web 应用日新月异的今天,许多搞技术的人似乎已经忘记了 Web 架构的设计初衷。他们在自己开发的网站或 Web 应用中大肆堆砌各种所谓的 “先进“技术,但最终用户能够在这些网站或应用中获得的有价值信息却寥寥无几。这个问题绝不像评论者常说的“有路无车“ 或“信息匮乏“那么简单。一个Web 开发者倘若忘记了 Web 技术的最终目标是提供信息和信息服务,他的愚蠢程度就丝毫不亚于一个在足球场上只知道卖弄技巧,却忘记了射门得分的大牌球星。从这个角度来说,评价一种 Web 开发技术优劣的标准只有一个,那就是看这种技术能否在最恰
4、当的时间和最恰当的地点,以最恰当的方式,为最需要信息的人提供最恰当的信息服务。客户端技术的萌芽和演进Web 是一种典型的分布式应用架构。Web 应用中的每一次信息交换都要涉及到客户端和服务端两个层面。因此,Web 开发技术大体上也可以被分为客户端技术和服务端技术两大类。我们先来谈谈客户端技术的萌芽和演进过程。Web 客户端的主要任务是展现信息内容,而 HTML 语言则是信息展现的最有效载体之一。作为一种实用的超文本语言,HTML 的历史最早可以追溯到上世纪四十年代。1945 年,Vannevar Bush 在一篇文章中阐述了文本和文本之间通过超级链接相互关联的思想,并在文中给出了一种能实现信息
5、关联的计算机Memex 的设计方案。 Doug Engelbart 等人则在 1960 年前后,对信息关联技术做了最早的实验。与此同时,Ted Nelson 正式将这种信息关联技术命名为超文本(Hypertext)技术。1969 年,IBM 的 Charles Goldfarb发明了可用于描述超文本信息的 GML(Generalized Markup Language)语言。1978 到 1986 年间,在ANSI 等组织的努力下,GML 语言进一步发展成为著名的 SGML 语言标准。当 Tim Berners-Lee 和他的同事们在 1989 年试图创建一个基于超文本的分布式应用系统时,Ti
6、m Berners-Lee 意识到,SGML 是描述超文本信息的一个上佳方案,但美中不足的是,SGML 过于复杂,不利于信息的传递和解析。于是,Tim Berners-Lee 对 SGML 语言做了大刀阔斧的简化和完善。1990 年,第一个图形化的 Web 浏览器“WorldWideWeb“终于可以使用一种为 Web 度身定制的语言-HTML 来展现超文本信息了。最初的 HTML 语言只能在浏览器中展现静态的文本或图像信息,这满足不了人们对信息丰富性和多样性的强烈需求-这件事情最终的结果是,由静态技术向动态技术的转变成为了 Web 客户端技术演进的永恒定律。能存储、展现二维动画的 GIF 图像
7、格式早在 1989 年就已发展成熟。Web 出现后,GIF 第一次为HTML 页面引入了动感元素。但更大的变革来源于 1995 年 Java 语言的问世。Java 语言天生就具备的平台无关的特点,让人们一下子找到了在浏览器中开发动态应用的捷径。1996 年,著名的 Netscape 浏览器在其 2.0 版中增加了对 JavaApplets 和 JavaScript 的支持。Netscape 的冤家对头,Microsoft 的 IE 3.0 也在这一年开始支持 Java 技术。现在,喜欢动画、喜欢交互操作、喜欢客户端应用的开发人员可以用 Java 或JavaScript 语言随心所欲地丰富 HT
8、ML 页面的功能了。顺便说一句,JavaScript 语言在所有客户端开发技术中占有非常独特的地位:它是一种以脚本方式运行的,简化了的 Java 语言,这也是脚本技术第一次在Web 世界里崭露头角。为了用纯 Microsoft 的技术与 JavaScript 抗衡,Microsoft 还为 1996 年的 IE 3.0 设计了另一种后来也声名显赫的脚本语言-VBScript 语言。真正让 HTML 页面又酷又炫、动感无限的是 CSS(Cascading Style Sheets)和 DHTML(Dynamic HTML)技术。1996 年底,W3C 提出了 CSS 的建议标准,同年,IE 3.
9、0 引入了对 CSS 的支持。CSS 大大提高了开发者对信息展现格式的控制能力。1997 年的 Netscape 4.0 不但支持 CSS,而且增加了许多Netscape 公司自定义的动态 HTML 标记,这些标记在 CSS 的基础上,让 HTML 页面中的各种要素“活动“了起来。1997 年,Microsoft 发布了 IE 4.0,并将动态 HTML 标记、CSS 和动态对象模型(DHTML Object Model)发展成了一套完整、实用、高效的客户端开发技术体系,Microsoft 称其为 DHTML。同样是实现 HTML 页面的动态效果, DHTML 技术无需启动 Java 虚拟机或
10、其他脚本环境,可以在浏览器的支持下,获得更好的展现效果和更高的执行效率。今天,已经很少有哪个 HTML 页面的开发者还会对 CSS和 DHTML 技术视而不见了。为了在 HTML 页面中实现音频、视频等更为复杂的多媒体应用,1996 年的 Netscape 2.0 成功地引入了对 QuickTime 插件的支持,插件这种开发方式也迅速风靡了浏览器的世界。在 Windows 平台上,Microsoft 将客户端应用集成的赌注押到了 1990 年代中期刚刚问世的 COM 和 ActiveX 身上。1996 年,IE 3.0 正式支持在 HTML 页面中插入 ActiveX 控件的功能,这为其他厂商
11、扩展 Web 客户端的信息展现方式开辟了一条自由之路。1999 年,Realplayer 插件先后在 Netscape 和 IE 浏览器中取得了成功,与此同时,Microsoft 自己的媒体播放插件 Media Player 也被预装到了各种 Windows 版本之中。同样值得纪念的还有Flash 插件的横空出世:1990 年代初期,Jonathan Gay 在 FutureWave 公司开发了一种名为 Future Splash Animator 的二维矢量动画展示工具,1996 年,Macromedia 公司收购了 FutureWave,并将 Jonathan Gay 的发明改名为我们熟悉
12、的 Flash。从此,Flash 动画成了 Web 开发者表现自我、展示个性的最佳方式。除了编写 HTML 页面之外,客户端应用的开发者还可以利用一些成熟的技术将浏览器的功能添加到自己的应用程序中。从 1992 年开始,W3C 就免费向开发者提供 libwww 开发库。借助 libwww,我们可以自己编写 Web 浏览器和 Web 搜索工具,也可以分析、编辑或显示 HTML 页面。1999 年,Microsoft 在IE 5.0 中引入的 HTAs(HTML Applications)技术则允许我们直接将 HTML 页面转换为一个真正的应用程序。从 1997 年的 IE 4.0 开始, Mic
13、rosoft 为开发者提供了 WebBrowser 控件和其他相关的 COM 接口,允许程序员在自己的程序中直接嵌入浏览器窗口,或调用各种浏览器的功能,如分析或编辑 HTML 页面等。Windows 98 及其后的 Windows 操作系统甚至还利用 WSH(Windows Script Host)技术将原本只在浏览器中运行的 JavaScript、VBScript 变成了可以在 WIN32 环境下使用的通用脚本语言,这大概也可算作我们对 Web 客户端开发技术的一种巧妙利用吧。服务端技术的成熟与发展与客户端技术从静态向动态的演进过程类似,Web 服务端的开发技术也是由静态向动态逐渐发展、完善
14、起来的。最早的 Web 服务器简单地响应浏览器发来的 HTTP 请求,并将存储在服务器上的 HTML 文件返回给浏览器。一种名为 SSI(Server Side Includes)的技术可以让 Web 服务器在返回 HTML 文件前,更新HTML 文件的某些内容,但其功能非常有限。第一种真正使服务器能根据运行时的具体情况,动态生成HTML 页面的技术是大名鼎鼎的 CGI(Common Gateway Interface)技术。1993 年,CGI 1.0 的标准草案由 NCSA(National Center for Supercomputing Applications)提出,1995 年,
15、NCSA 开始制定 CGI 1.1 标准,1997 年,CGI 1.2 也被纳入了议事日程。CGI 技术允许服务端的应用程序根据客户端的请求,动态生成HTML 页面,这使客户端和服务端的动态信息交换成为了可能。随着 CGI 技术的普及,聊天室、论坛、电子商务、信息查询、全文检索等各式各样的 Web 应用蓬勃兴起,人们终于可以享受到信息检索、信息交换、信息处理等更为便捷的信息服务了。早期的 CGI 程序大多是编译后的可执行程序,其编程语言可以是 C、C+ 、Pascal 等任何通用的程序设计语言。为了简化 CGI 程序的修改、编译和发布过程,人们开始探寻用脚本语言实现 CGI 应用的可行方式。在
16、此方面,不能不提的是 Larry Wall 于 1987 年发明的 Perl 语言。Perl 结合了 C 语言的高效以及sh、awk 等脚本语言的便捷,似乎天生就适用于 CGI 程序的编写。1995 年,第一个用 Perl 写成的 CGI 程序问世。很快,Perl 在 CGI 编程领域的风头就盖过了它的前辈 C 语言。随后,Python 等著名的脚本语言也陆续加入了 CGI 编程语言的行列。1994 年,Rasmus Lerdorf 发明了专用于 Web 服务端编程的 PHP(Personal Home Page Tools)语言。与以往的 CGI 程序不同,PHP 语言将 HTML 代码和
17、PHP 指令合成为完整的服务端动态页面,Web 应用的开发者可以用一种更加简便、快捷的方式实现动态 Web 功能。1996 年,Microsoft 借鉴 PHP 的思想,在其 Web 服务器 IIS 3.0 中引入了 ASP 技术。ASP 使用的脚本语言是我们熟悉的 VBScript 和 JavaScript。借助 Microsoft Visual Studio 等开发工具在市场上的成功,ASP 迅速成为了 Windows 系统下 Web 服务端的主流开发技术。当然,以 Sun 公司为首的 Java 阵营也不会示弱。1997 年,Servlet 技术问世,1998 年,JSP 技术诞生。Ser
18、vlet 和 JSP 的组合(还可以加上 JavaBean 技术)让 Java 开发者同时拥有了类似 CGI 程序的集中处理功能和类似 PHP 的 HTML 嵌入功能,此外,Java 的运行时编译技术也大大提高了 Servlet和 JSP 的执行效率- 这也正是 Servlet 和 JSP 被后来的 J2EE 平台吸纳为核心技术的原因之一。 两种重要的企业开发平台Web 服务端开发技术的完善使开发复杂的 Web 应用成为了可能。在此起彼伏的电子商务大潮中,为了适应企业级应用开发的各种复杂需求,为了给最终用户提供更可靠、更完善的信息服务,两个最重要的企业级开发平台-J2EE 和.NET 在 20
19、00 年前后分别诞生于 Java 和 Windows 阵营,它们随即就在企业级Web 开发领域展开了你死我活的拼争。平台之争让整个 Web 世界在最近的几年里不得安宁,但从某种意义上说,也正是这种针锋相对的竞争关系促使了 Web 开发技术以前所未有的速度提高和跃进。J2EE 是纯粹基于 Java 的解决方案。1998 年,Sun 发布了 EJB 1.0 标准。EJB 为企业级应用中必不可少的数据封装、事务处理、交易控制等功能提供了良好的技术基础。至此,J2EE 平台的三大核心技术Servlet、 JSP 和 EJB 都已先后问世。1999 年,Sun 正式发布了 J2EE 的第一个版本。紧接着
20、,遵循 J2EE标准,为企业级应用提供支撑平台的各类应用服务软件争先恐后地涌现了出来。IBM 的WebSphere、BEA 的 WebLogic 都是这一领域里最为成功的商业软件平台。随着开源运动的兴起, JBoss等开源世界里的应用服务新秀也吸引了许多用户的注意力。到 2003 年时,Sun 的 J2EE 版本已经升级到了 1.4 版,其中三个关键组件的版本也演进到了 Servlet 2.4、JSP 2.0 和 EJB 2.1。至此,J2EE 体系及相关的软件产品已经成为了 Web 服务端开发的一个强有力的支撑环境。和 J2EE 不同的是,Microsoft 的.NET 平台是一个强调多语言
21、间交互的通用运行环境。尽管.NET 的设计者试图以.NET 平台作为绝大多数 Windows 应用的首选运行环境,但 .NET 首先吸引的却是 Web 开发者的目光。2001 年,ECMA 通过了 Microsoft 提交的 C#语言和 CLI 标准,这两个技术标准构成了.NET 平台的基石,它们也于 2003 年成为了 ISO 的国际标准。2002 年,Microsoft 正式发布.NET Framework 和Visual Studio .NET 开发环境。早在.NET 发布之前,就已经有许多 Windows 平台的 Web 开发者迫不及待地利用 Beta 版本开发 Web 应用了。这大概
22、是因为,.NET 平台及相关的开发环境不但为 Web 服务端应用提供了一个支持多种语言的、通用的运行平台,而且还引入了 ASP.NET 这样一种全新的 Web 开发技术。ASP.NET 超越了 ASP 的局限,可以使用 VB.NET、C#等编译型语言,支持 Web Form、.NET Server Control、ADO.NET 等高级特性。客观地讲,.NET 平台,尤其是.NET 平台中的 ASP.NET 的确不失为Web 开发技术在 Windows 平台上的一个集大成者。XML 语言及相关技术如果说 HTML 语言给 Web 世界赋予了无限生机的话,那么,XML 语言的出现大概就可以算成是
23、Web 的一次新生了。按照 Tim Berners-Lee 的说法,Web 是一个“信息空间“。HTML 语言具有较强的表现力,但也存在结构过于灵活、语法不规范的弱点。当信息都以 HTML 语言的面貌出现时,Web 这个信息空间是杂乱无章、没有秩序的。为了让 Web 世界里的所有信息都有章可循、有法可依,我们需要一种更为规范、更能够体现信息特点的语言。1996 年,W3C 在 SGML 语言的基础上,提出了 XML(Extensible Markup Language)语言草案。1998 年,W3C 正式发布了 XML 1.0 标准。XML 语言对信息的格式和表达方法做了最大程度的规范,应用软
24、件可以按照统一的方式处理所有 XML 信息。这样一来,信息在整个 Web 世界里的共享和交换就有了技术上的保障。HTML 语言关心的是信息的表现形式,而 XML 语言关心的是信息本身的格式和数据内容。从这个意义上说,XML 语言不但可以将客户端的信息展现技术提高到一个新的层次,而且可以显著提高服务端的信息获取、生成、发布和共享能力。为了将 XML 信息转换为 HTML 等不同的信息展现形式,1999 年,W3C 制定出了 XSLT 标准。同一年,IE 5.0 增加了对 XML 和 XSLT 的支持。现在,网站的开发者可以直接使用 XML 语言发布信息了。针对不同的应用领域,人们还制定了许多专门
25、的 XML 规范。例如, 2001 年 W3C 发布的 SVG(Scalable Vector Graphics)1.0 标准就是一种用XML 语言表达的、全新的二维矢量图形格式。开发者可以用 SVG 格式描述大多数已有的 Flash 动画。与Flash 格式相比,符合 XML 标准的 SVG 格式显然更有利于信息交换和共享。Web 本身就是一个最大的分布式应用系统。对于分布式开发而言, XML 技术也大有用武之地。一个明显的事实是,如果能让分布式应用借助 XML 格式交换信息,那么,以往横亘在分布式架构上的信息交换难题也就迎刃而解了。1999 年,W3C 和相关的企业开始讨论设计基于 XML
26、 的通信协议,2000 年,W3C 发布 SOAP(Simple Object Access Protocol)协议的 1.1 版。人们把利用 SOAP 协议传递 XML 信息的分布式应用模型称为 Web Service。2001 年,W3C 发布了 WSDL(Web Services Description Language)协议的 1.1 版。SOAP 协议和 WSDL 协议共同构成了 Web Service 的基础。随后,J2EE 和.NET 这两大企业级开发平台先后实现了 Web Service,并将其视为平台的一项核心功能。Web Service 对于 Web 开发者的重要意义在于,
27、当我们需要在不同的服务端、不同的客户端乃至不同的应用类型、不同的计算设备之间传递信息的时候,以往的分布式开发技术或者因为适应性不强,或者因为扩展能力不足,都难以满足现代 Web 开发的需要,而 Web Service 正好填补了这一空白。Web 开发框架和应用模型2000 年以后,随着 Web 应用的日益复杂,人们逐渐意识到,单纯依靠某种技术多半无法达到快速开发、快速验证和快速部署的最佳境界。研究者开始尝试着将已有的 Web 开发技术综合起来,形成完整的开发框架或应用模型,并以此来满足各种复杂的应用需求。Microsoft 在客户端的技术集成方面走在了最前面。1998 年时 Microsoft
28、 推出的 Windows 98 就可以在桌面上集成 Web 页面,这实际上是将资源管理器和 Web 浏览器的功能有效地结合了起来。2000 年后,Microsoft 陆续推出了 MSN Explorer 和与之相关的 MSN 在线服务。这一应用模型将 Web 浏览、视频点播、邮件处理、网上游戏、在线聊天等许多种用户常用的 Web 功能集成在了一个统一的界面中。从信息利用的角度看,MSN 试图让用户在一个最舒适的环境中获取足够的信息,这种努力的确值得人们称道。另一个与客户端技术集成相关的例子是搜索引擎 Google 在 2003 年展示给大家的 Google 工具栏功能。虽然Google 工具栏
29、有炒作和广告的嫌疑,但安装 Google 工具栏之后的 IE 浏览器将信息浏览和信息检索有机地结合了起来,这种小小的功能改进确实是对用户的体贴和帮助。在 Web 服务端,2000 年以后出现了几种主要的技术融合方式。首先,越来越多的 Web 开发环境开始支持 MVC(Model-View-Contorller )的设计模型,为开发者提供了全套的开发框架。实际上, J2EE 和.NET 平台本身就是这种开发框架的典型代表。其次,门户服务(Portal Server)和 Web 内容管理(Web Content Management)在最近几年里成为了应用集成的重点模型。这两种应用模型可以直接为开
30、发者或最终用户提供构建 Web 应用的高级平台,可以让 Web 开发和信息发布工作大为简化。在商业软件领域,这一类应用的例子包括 Microsoft 的 SharePoint、IBM 的 WebSphere Portal、FileNet 的 Web Content Manager等等。开源项目在 Web 开发框架和应用模型方面表现得非常积极,Struts、Jetspeed、jPortlet、Cocoon、Lenya、XOOPS 等都是开源世界里与 MVC 开发框架、门户服务和Web 内容管理相关的优秀解决方案。当然,技术集成绝不等于技术堆砌。一些 Web 站点和 Web 应用的开发者把 XML
31、 语言、MVC 框架等时髦技术拼凑起来,却不管它们是否能适应具体的应用环境,结果,他们的系统要么运行效率低下,要么功能残缺不全。反之,一个值得注意的事实是,像新浪、搜狐或网易这样的门户网站,在他们的信息发布页面(如新闻页面)里,尽管信息内容时刻都在刷新,但 Web 服务器上存放的始终都是静态的HTML 页面。这种“ 落后技术 “的优点是,在大量并发访问的情况下,门户网站的响应速度仍然很快。深入到技术层面,我们通常会惊讶地发现,这些网站使用的大多是自行研发的 Web 内容管理系统。当网站的内容编辑提交新的信息时,系统会自动将信息转换为 HTML 格式,发布到 Web 服务器集群的每一个结点上。在
32、新浪网的一个角落里,我们可以找到“新浪网站发布系统“ 的研发历程:V 1.0(1997):基于文件的版本,实现新闻首页、正文和专题的发布。V 1.1(1998/12):采用数据库后台、实现跨服务器发布,自动化程度高。V 2.0(1999/3):创立模版和域的全新概念,奠定了该系列的基本设计思路。V 2.1(1999/9):增加周边模块,如搜索、自动采集。V 3.0(2000/1):优化传输方式,增加相关新闻和评论。V 3C(2000/6):V3.0 的编译版,也是商业版的原型。V 3.1(2000/7):优化数据库结构,采用内存 CACHE 大幅提速,增加了集中监控功能。V 3.1C(2000
33、/8):商业用测试版本。V 3.2(正在制作中):重点解决备份系统的自动化切换,在机制上实现永不宕机。 这一份有趣的历史记录再一次印证了我关于 Web 开发技术的基本观点:一种技术只要能为用户提供高水平的信息服务,它就是最好、最先进的技术。Web 开发技术的未来所有人都在关心 Web 的发展前景,所有人都想知道十年以后的 Web 会长成什么样子。要回答这些问题,没有谁比 W3C 更有权威了。W3C 明确地告诉我们,Web 的未来是语义化的 Web(Semantic Web) 。今天的 Web 可以自如地生成、传递和展现各式各样的信息,但它还只是一个信息的 “容器“,很难揭示出信息本身的内容和特
34、性。与此相对的是,未来的语义化 Web 是一种懂得信息内容的 Web,是真正的“信息管理员“。从技术角度看,XML 语言统一了信息的表达方式,但这离揭示信息内容的目标还相距甚远。1998 年,W3C 和一些研究机构开始对元数据(Metadata)进行研究。元数据是描述数据的数据,可以揭示信息的内容特性。1999 年,NetScape 提出的 RSS(Rich Site Summary)建议标准是用元数据技术描述新闻等信息内容的第一次尝试。1999 年,W3C 的研究小组提出了 RDF(Resource Description Framework)标准草案。RDF 在 XML 语法的基础上,规定
35、了元数据的存储结构和相关的技术标准。使用 RDF 语言,我们可以用统一的、可交换的格式揭示出信息本身的各种特性。2001 年,W3C 又开始着手制定 OWL(OWL Web Ontology Language)标准。 OWL 语言也是一种符合 XML 标准的语言,它比 RDF 又前进了一步,可以更加深入、细致地描述信息内容。在 RDF 和 OWL 语言的帮助下,我们能让 Web 上的信息内容变得更容易理解、更便于交换和共享。2003 年,W3C 成立了语义化 Web Service 研究小组(Semantic Web Services Interest Group) ,研究在 Web Service 中加入语义技术的相关问题。 2004 年 2 月,W3C 宣布 RDF和 OWL 标准正式成为 W3C 的建议方案,这标志着语义化 Web 的大厦已经破土动工。随着语义化 Web 的诞生和发展,Web 开发技术也必将经历更为重大的变革。可以预见的是,在未来的几年里,还会有许多新的开发技术或开发平台出现。从静态技术到动态技术,从开发平台到应用模型,从传统 Web 到语义化 Web为了让更多的人获得更有价值的信息服务,Web 开发者们也许还会经历一次又一次的技术浪潮,还会面临更为严峻的技术挑战,但这和信息共享的最高目标相比,又算得了什么呢?