1、JVM(Java虚拟机) 简介1,什么是Java虚拟机 Java虚拟机(JVM)是Java Virtual Machine的缩写,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能模拟来实现的。Java虚拟机有自己完善的硬件架构,如处理器、堆栈、寄存器等,还具有相应的指令系统。 2,为什么使用Java虚拟机?Java语言最重要的特点就是可以在任何操作系统(跨平台)中运行。使用Java虚拟机就是为了支持与操作系统无关,在任何系统中都可以运行。 3,Java虚拟机的基本原理Java虚拟机屏蔽了与具体操作系统平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的
2、目标代码(字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,实际上最终还是把字节码解释成具体平台上的机器指令执行。 Java的平台无关性是Java最重要的特性,而实现这一特性的基础就是 Java虚拟机。因此,了解Java 虚拟机的结构和工作方式对进一步理解Java概念十分有益。下面我们将从两个方面介绍Java虚拟机。 什么是Java 虚拟机 从底层看,Java虚拟机就是以Java字节码为指令组的软CPU。附图显示了Java系统流程图(内含Java 虚拟机) 。从附图可以看出,在服务器端首先由开发人员编写 Java程序并存为. Java文件;其次,Java编译器将.jav
3、a 文件编译成由字节码组成的 .class文件;最后,将.class文件存放在Web服务器上。到此,Java程序已作为Internet 或Intranet 资源存放在Web 服务器上随时可让客户使用。在客户端,用户使用WWW浏览器,通过Internet/Intranet将Web服务器上的含有Java程序的主页下载,再依赖本地Java虚拟机对.class文件解释执行。这样,内容丰富的 Java应用资源便由服务器传送到客户端,并在用户浏览器上显示出来。 和普通的程序装入器一样,Java虚拟机执行程序时首先从网络或本地存储器中装入 .class文件。由于网络的不安全因素较多,Hacker的恶意攻击,
4、网络病毒的侵袭等等,因此,Java 虚拟机在执行.class文件前,首先要对其进行验证。如果没有通过验证,则不执行并给出错误信息,相反,如果程序成功地经过验证阶段,Java虚拟机将运行翻译器读取字节码,把字节码转换成操作系统硬件相关的指令,并在真正的CPU上执行。 字节码是Java 虚拟机的指令组(很象CPU上的微码) 。字节码形式为。其中,操作码就是指令码,占一个字节的长度,一个字节码可以有多少操作数。目前,Java虚拟机规范中定度了220个字节码指令。由于字节码指令数目种类繁多,相对于机器码语义层次较高,因此,Java语言编译成字节码后文件尺寸较小便于网络传输。为了运行 Java字节码,硬
5、件厂商或操作系统厂商在自己的硬件和操作系统组合中实现Java虚拟机。Java 虚拟机程序模块通常用C 、C或相应CPU 支持的汇编语言编写。Java 虚拟机用主机操作系统帮助完成内存、文件系统、显示器、鼠标、键盘、网络和其它设备驱动器以及线程处理等。另外,各厂商开发自己系统的Java虚拟机需要获得Java许可证。标准的Javasoft 许可包括Java 类库和Java虚拟机。每个拿到许可证的公司都会在自己的平台上成为Java的监护人,他们可以优化系统性能,但必须保证独立于平台的纯Java小程序能在他们的系统上运行。 从概念上讲,Java虚拟机的基本执行单元是.class文件。一个 Java程序
6、经过编译后将形成多个.class文件,而每个文件都对应一个程序中定义的类。因此,带有多个.class文件的Java 程序在执行时与传统程序相比就有其特殊性。传统的程序在运行前,系统要装入含有全部程序码的单一执行文件,而Java虚拟机在执行程序时则不同,它遵循 “即用即装入“的原则。具体讲,由于一个.class文件可以引用许多其它.class文件(在Java语言中,通过import,implement或extends语句实现) ,当运行的类需要其他类时,Java虚拟机即从网络或本地文件系统装入 .class文件。将这个概念拓广,不同类可以由不同开发者在不同服务器上开发,Java虚拟机能够动态地装
7、入和联接所需要的类文件。这对今后软件开发以及分布式计算都将有深远的意义。例如:这种结构可以使在服务器向客户机提供软件新版本时,只更新相应的.class文件,真正实现零管理客户机以及无版本软件等。 另外,Java 虚拟机是使.class文件具有跨平台能力的核心结构,同一 .class文件可以运行在实现Java虚拟机的不同计算机上。虚拟机只需要知道.class文件应该是什么结构和应当包含什么,而不必管.class文件对应的源程序代码是由何种语言编写的。由于各种语言的编译器与Java 虚拟机本身无关,因此只要不同语言的编译器能从这些源文件中产生Java字节码,开发人员就可以使用各人所熟悉的Ada,C
8、或C语言编写的运行在任何Java虚拟机上的应用程序,而不必一定要学习Java 语言。实现以上所说的内容,将大大简化现有软件向平台无关软件转化的工作。Java虚拟机一、 什么是Java虚拟机 Java虚拟机是一个想象中的机器,在实际的计算机上通过软件模拟来实现。Java虚拟机有自己想象中的硬件 ,如处理器、堆栈、寄存器等, 还具有相应的指令系统。 1.为什么要使用Java虚拟机? Java语言的一个非常重要的特点就是与平台的无关性。而使用Java 虚拟机是实现这一特点的关键。一般的高级语言如果要在不同的平台上运行, 至少需要编译成不同的目标代码。而引入Java语言虚拟机后,Java语言在不同平台
9、上运行时不需要重新编译. Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码 (字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。 2.谁需要了解Java虚拟机 Java虚拟机是Java语言底层实现的基础,对Java语言感兴趣的人都应对Java虚拟机有个大概的了解。这有助于理解Java 语言的一些性质, 也有助于使用Java语言。 对于要在特定平台上实现Java虚拟机的软件人员 ,Java语言的编译器作者以及要用硬件芯片实现Java虚拟机的人来说 ,则必须深刻理解Java虚拟
10、机的规范。 另外,如果你想扩展 Java语言,或是把其它语言编译成Java 语言的字节码,你也需要深入地了解Java虚拟机。 3.Java虚拟机支持的数据类型 Java虚拟机支持Java语言的基本数据类型如下 : byte:/1字节有符号整数的补码short:/2字节有符号整数的补码 int:/4字节有符号整数的补码 long:/8字节有符号整数的补码float:/4字节IEEE754单精度浮点数 double:/8字节IEEE754双精度浮点数 char:/2字节无符号 Unicode字符 几乎所有的Java类型检查都是在编译时完成的。上面列出的原始数据类型的数据在 Java执行时不需要用硬
11、件标记。操作这些原始数据类型数据的字节码(指令) 本身就已经指出了操作数的数据类型, 例如iadd、ladd、fadd 和dadd指令都是把两个数相加,其操作数类型特别是int、long 、 float和double。 虚拟机没有给boolean(布尔)类型设置单独的指令。boolean型的数据是由integer指令, 包括integer返回来处理的。boolean型的数组则是用byte数组来处理的。 虚拟机使用IEEE754格式的浮点数。不支持IEEE 格式的较旧的计算机,在运行Java数值计算程序时 ,可能会非常慢。 虚拟机支持的其它数据类型包括: object/对一个Javaobject
12、(对象)的4字节引用returnAddress/4字节,用于jsr/ret/jsr-w/ret-w 指令 注:Java数组被当作 object处理。 虚拟机的规范对于object内部的结构没有任何特殊的要求。在Sun公司的实现中,对 object的引用是一个句柄,其中包含一对指针:一个指针指向该object的方法表,另一个指向 该object的数据。 用Java虚拟机的字节码表示的程序应该遵守类型规定。Java 虚拟机的实现应拒绝执行违反了类型规定的字节码程序。 Java虚拟机由于字节码定义的限制似乎只能运行于32 位地址空间的机器上。但是可以创建一个Java虚拟机,它自动地把字节码转换成64
13、位的形式。 从Java虚拟机支持的数据类型可以看出 ,Java对数据类型的内部格式进行了严格规定,这样使得各种Java虚拟机的实现对数据的解释是相同的,从而保证了Java的与平台无关性和可移植性。 二、 Java虚拟机体系结构 Java虚拟机由五个部分组成:一组指令集、一组寄存器、一个栈、一个无用单元收集堆(Garbage-collected-heap)、一个方法区域。这五部分是Java虚拟机的逻辑成份 ,不依赖 任何实现技术或组织方式, 但它们的功能必须在真实机器上以某种方式实现。 Java指令集 Java虚拟机支持大约248个字节码。每个字节码执行一种基本的CPU运算,例如,把一个整数加到
14、寄存器,子程序转移等。 Java指令集相当于Java程序的汇编语言。 Java指令集中的指令包含一个单字节的操作符,用于指定要执行的操作,还有0个或多个操作数,提供操作所需的参数或数据。许多指令没有操作数,仅由一个单字节的操作符构成。虚拟机的内层循环的执行过程如下: do 取一个操作符字节; 根据操作符的值执行一个动作; while(程序未结束) 由于指令系统的简单性,使得虚拟机执行的过程十分简单, 从而有利于提高执行的效率。 指令中操作数的数量和大小是由操作符决定的。如果操作数比一个字节大,那么它存储的顺序是高位字节优先。例如, 一个16位的参数存放时占用两个字节,其值为: 第一个字节*25
15、6+第二个字节 字节码指令流一般只是字节对齐的。指令tableswitch和lookup是例外,在这两条指令内部 要求强制的4字节边界对齐。 寄存器 Java虚拟机的寄存器用于保存机器的运行状态,与微处理器中的某些专用寄存器类似。 Java虚拟机的寄存器有四种 : pc:Java程序计数器。 optop:指向操作数栈顶端的指针。 frame:指向当前执行方法的执行环境的指针。 vars:指向当前执行方法的局部变量区第一个变量的指针。 Java虚拟机 Java虚拟机是栈式的,它不定义或使用寄存器来传递或接受参数, 其目的是为了保证指令集的简洁性和实现时的高效性(特别是对于寄存器数目不多的处理器)
16、。所有寄存器都是32 位的。 栈 Java虚拟机的栈有三个区域:局部变量区、运行环境区、操作数区。 局部变量区 每个Java方法使用一个固定大小的局部变量集。它们按照与vars寄存器的字偏移量来寻址。局部变量都是32位的。长整数和双精度浮点数占据了两个局部变量的空间,却按照第一个局部变量的索引来寻址。(例如,一个具有索引n的局部变量,如果是一个双精度浮点数 ,那么它实际占据了索引 n和n+1 所代表的存储空间。)虚拟机规范并不要求在局部变量中的64位的值是64位对齐的虚拟机提供了把局部变量中的值装载到操作数栈的指令,也提供了把操作数栈中的值写入局部变量的指令。 运行环境区 在运行环境中包含的信
17、息用于动态链接,正常的方法返回以及异常传播。 动态链接 运行环境包括对指向当前类和当前方法的解释器符号表的指针,用于支持方法代码的动态链接。方法的class文件代码在引用要调用的方法和要访问的变量时使用符号。动态链接把符号形式的方法调用翻译成实际方法调用,装载必要的类以解释还没有定义的符号, 并把变量访问翻译成与这些变量运行时的存储结构相应的偏移地址。动态链接方法和变量使得方法中使用的其它类的变化不会影响到本程序的代码。 正常的方法返回 如果当前方法正常地结束了,在执行了一条具有正确类型的返回指令时,调用的方法会得到一个返回值。 执行环境在正常返回的情况下用于恢复调用者的寄存器,并把调用者的程
18、序计数器增加一个恰当的数值,以跳过已执行过的方法调用指令, 然后在调用者的执行环境中继续执行下去。 异常和错误传播 异常情况在Java中被称作 Error(错误)或Exception(异常),是Throwable类的子类,在程序中出错的原因是:动态链接错,如无法找到所需的class文件。 运行时错,如对一个空指针的引用 程序使用了throw语句。 当异常发生时,Java 虚拟机采取如下措施: 检查与当前方法相联系的catch子句表。每个catch子句包含其有效指令范围,能够处理的异常类型,以及处理异常的代码块地址。 与异常相匹配的catch子句应该符合下面的条件: 造成异常的指令在其指令范围之
19、内 ,发生的异常类型是其能处理的异常类型的子类型。如果找到了匹配的catch 子句,那么系统转移到指定的异常处理块处执行;如果没有找到异常处理块,重复寻找匹配的catch子句的过程,直到当前方法的所有嵌套的catch 子句都被检查过。 由于虚拟机从第一个匹配的catch子句处继续执行, 所以catch子句表中的顺序是很重要的。因为Java代码是结构化的 ,因此总可以把某个方法的所有的异常处理器都按序排列到一个表中,对任意可能的程序计数器的值,都可以用线性的顺序找到合适的异常处理块, 以处理在该程序计数器值下发生的异常情况。 如果找不到匹配的catch子句,那么当前方法得到一个“未截获异常“的结
20、果并返回到当前方法的调用者,好像异常刚刚在其调用者中发生一样。如果在调用者中仍然没有找到相应的异常处理,那么系 统将调用一个缺省的异常处理块。 操作数栈区 机器指令只从操作数栈中取操作数,对它们进行操作, 并把结果返回到栈中。选择栈结构的原因是:在只有少量寄存器或非通用寄存器的机器(如Intel486)上 ,也能够高效地模拟虚拟机的行为。 操作数栈是32位的。它用于给方法传递参数,并从方法接收结果, 也用于支持操作的参数,并保存操作的结果。 例如,iadd指令将两个整数相加。相加的两个整数应该是操作数栈顶的两个字。这两个字是由先前的指令压进堆栈的。这两个整数将从堆栈弹出、相加,并把结果压回到操
21、作数栈中。每个原始数据类型都有专门的指令对它们进行必须的操作。每个操作数在栈中需要一个存储位置,除了long和double型, 它们需要两个位置。 操作数只能被适用于其类型的操作符所操作。例如,压入两个int 类型的数,如果把它们当作是一个long类型的数则是非法的。在Sun的虚拟机实现中,这个限制由字节码验证器强制实行。但是, 有少数操作(操作符dupe和swap),用于对运行时数据区进行操作时是不考虑类型的。 无用单元收集堆 Java的堆是一个运行时数据区,类的实例( 对象) 从中分配空间。Java语言具有无用单元收集能力:它不给程序员显式释放对象的能力。Java不规定具体使用的无用单元收
22、集算法,可以根据系统的需求使用各种各样的算法。 方法区 方法区与传统语言中的编译后代码或是Unix进程中的正文段类似。它保存方法代码 (编译后的java代码)和符号表。在当前的 Java实现中, 方法代码不包括在无用单元收集堆中,但计划在将来的版本中实现。每个类文件包含了一个Java类或一个Java 界面的编译后的代码。可以说类文件是 Java语言的执行代码文件。为了保证类文件的平台无关性,Java虚拟机规范中对类文件的格式也作了详细的说明。其具体细节请参考Sun公司的Java虚拟机规范 三、 Java类文件(.class文件) 每个类文件包含了一个Java类或一个Java 界面的编译后的代码
23、。可以说类文件是Java语言的执行代码文件。为了保证类文件的平台无关性,Java虚拟机规范中对类文件的格式也作了详细的说明。其具体细节请参考Sun公司的Java虚拟机规范。 四、 Java芯片 由于Java语言是解释型语言 ,在一般的通用处理器上其运行速度比起编译型语言要慢很多。Sun公司为了进一步推广Java的应用,推出了Java芯片。这些芯片可以说是Java虚拟机的硬件实现。与通用芯片和解释器构成的虚拟机不同,Java芯片可以直接执行字节码, 也就是说,字节码就是 Java芯片的指令集。这种用硬件实现的虚拟机当然要比软件模拟的虚拟机的速度要快得多。 Sun公司计划推出的Java 芯片有三种:picoJava,mi-croJava和ultraJava。 picoJava是一个很小的Java 内核芯片,其硅片面积只有 25mm2。Sun公司准备向其它公司转让,以便其它公司可以定制自己的Java芯片, 其低端产品的售价估计不到25美元。 microJava是基于picoJava的微控制器芯片, 其芯片面积约为50mm2, 用于通信设备和其它嵌入式控制设备。Sun公司希望Java芯片可以成为推动Java发展的主要技术之一。