汉字的机内码是指在计算机中表示一个汉字的编码.doc

上传人:11****ws 文档编号:3251449 上传时间:2019-05-27 格式:DOC 页数:9 大小:98KB
下载 相关 举报
汉字的机内码是指在计算机中表示一个汉字的编码.doc_第1页
第1页 / 共9页
汉字的机内码是指在计算机中表示一个汉字的编码.doc_第2页
第2页 / 共9页
汉字的机内码是指在计算机中表示一个汉字的编码.doc_第3页
第3页 / 共9页
汉字的机内码是指在计算机中表示一个汉字的编码.doc_第4页
第4页 / 共9页
汉字的机内码是指在计算机中表示一个汉字的编码.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。汉字区位码的区码和位码的取值均在 194 之间,如直接用区位码作为机内码,就会与基本 ASCII码混淆。为了避免机内码与基本 ASCII 码的冲突,需要避开基本 ASCII 码中的控制码(00H1FH),还需与基本 ASCII 码中的字符相区别。为了实现这两点,可以先在区码和位码分别加上 20H,在此基础上再加 80H(此处“H” 表示前两位数字为十六进制数 )。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示:高位字节区码+20H+80H(或区码+A0H)低位

2、字节=位码+20H+80H(或位码+AOH)由于汉字的区码与位码的取值范围的十六进制数均为 01H5EH(即十进制的 0194),所以汉字的高位字节与低位字节的取值范围则为 A1HFEH(即十进制的 161254)。例如,汉字“啊” 的区位码为 1601,区码和位码分别用十六进制表示即为 1001H,它的机内码的高位字节为 B0H,低位字节为 A1H,机内码就是 B0A1H。2603 = 1A03H 区位码+ A0A0H= BAA3H 机内码 本帖最后由 rossini23 于 2006-10-11 13:28 编辑 计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉

3、字信息在系统内传送的过程就是汉字编码转换的过程。 汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集基本集”,代号为 GB 231280,又称为“国标码 ”。 国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 231280 就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有 7 位,与 ASCII 码相似。 区位码:将 GB 231280 的全部字符集组成一个 9494 的方阵,每一行称为一个“区”,编号

4、为 0l94;每一列称为一个“位 ”,编号为 0l94 ,这样得到 GB 231280 的区位图,用区位图的位置来表示的汉字编码,称为区位码。 机内码:为了避免 ASCII 码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置 1 作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。 汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H 得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加 1,即汉字交换码(国标码)的两个字节分别加 80H 得到对应的

5、机内码;区位码(十进制)的两个字节分别转换为十六进制后加 A0H 得到对应的机内码。1、区位码和国标码 (1)国标:1981 年,我国制订了“中华人们共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。 (2)区位码:按国标规定,汉字编码表有 94 行 94 列,其行号 0194 称为区号,列号 0194 称为位号。一个汉字所在的区号和位号简单地组合在一起就构成了这个汉字的区位码。 GB2312-80 区位码=区号+位号(采用十进制) 符:2391 例 1:汉字“啊”处于 16 区的 01 位,则其区位码为 1601。 (3)国标码:又称为“交换码”,它是在不同汉字处理系统间进行汉

6、字交换时所使用的编码。国标码采用两个字节表示,它与区位码的关系是:国标码高位字节=(区号)16+(20)16 国标码低位字节=(位号)16+(20)16 例 2:汉字“啊”的区位码为 1601,则其国标码为(3021)16。 2、汉字内码(机内码) (1)概念:在计算机内部表示汉字的代码。(2)特点:汉字内码采用两个字节,一个汉字占两个 ASCII 字符;汉字内码最高位为 1,ASCII 码最高位为 0 (3)汉字内码与区位码的关系:汉字内码高位字 . GB2312-1980 信息交换用汉字编码字符集 基本集GB11383-1989 信息处理 信息交换用八位代码结构和编码规则 GB2311-1

7、990 信息处理 七位和八位编码字符集代码扩充技术 GB12345-1990 信息交换用汉字编码字符集 辅助集GB13000.1-1993 信息技术 通用多八位编码字符集(UCS)第一部分GBK-1995 技术规范指导性文件 汉字内码扩展规范(GBK)1.0 版GB18030-2000 信息技术 信息交换用汉字编码字符集 基本集的扩充上面是我国颁布并实施的有关编码方案-后面为发布年份 和名称GB2312 共收录 6763 个简体汉字,是一般输入法的默认编码 GBK 共收录 21004 个汉字(包括简体和繁体),是字库庞大的输入法的首选编码BIG5 即通常说的大五码,是港台地区使用的繁体中文编码

8、规格。GB18030 分别以单字节、双字节和四字节进行编码。兼容了 GBK 和 GB2312。当然也支持繁体中文 RAM 是随机存取存储器,它的特点是易挥发性,即掉电失忆。 ROM 通常指固化存储器(一次写入,反复读取),它的特点与 RAM 相反。ROM 又分一次性固化、光擦除和电擦除重写两种类型你提的问题应该是计算机中的术语(根据问题分类)。因此,简单地说,在计算机中,RAM 、ROM 都是数据存储器。RAM 是随机存取存储器,它的特点是易挥发性,即掉电失忆。ROM 通常指固化存储器 (一次写入,反复读取),它的特点与 RAM 相反。ROM 又分一次性固化、光擦除和电擦除重写两种类型。 参考

9、资料:计算机原理类书籍 ram -random access memory rom -read only memory ram 随机存储器 rom 只读存储器 RAM:随机存储器。 ROM:只读存储器。 通俗的讲:内存就是一种 RAM,内存的数据无法长期保存,断电后数据就会丢失。但你可以将内存的数据保存到硬盘、光盘还有 U 盘中。硬盘、光盘还有 U 盘就是所谓的 ROM。 存储器分为随机存储器( RAM)和只读存储器(ROM)两种。其中通常用来固化存储一些生产厂家写入的程序或数据,用于启动电脑和控制电脑的工作方式。而则用来存取各种动态的输入输出数据、中间计算结果以及与外部存储器交换的数据和暂存

10、数据。设备断电后,中存储的数据就会丢失。运行游戏、程序速度快慢看的是,也就是动态内存,不是看。是静态空间,用来存储东西的,相当于手机的盘。和就好比是电脑的内存和硬盘。盘准确的来讲也不应该叫只读存储器。盘应该叫,因为盘是可擦写的,而的大小并不影响运行速度。RAM(RandomAccessMemory)的全名为随机存取记忆体,它相当于PC 机上的移动存储,用来存储和保存数据的。它在任何时候都可以读写,RAM 通常是作为操作系统或其他正在运行程序的临时存储介质(可称作系统内存) 。不过,当电源关闭时RAM 不能保留数据,如果需要保存数据,就必须把它们写入到一个长期的存储器中(例如硬盘) 。正因为如此

11、,有时也将 RAM 称作“可变存储器”。RAM 内存可以进一步分为静态RAM(SRAM)和动态内存( DRAM)两大类。DRAM 由于具有较低的单位容量价格,所以被大量的采用作为系统的主记忆。RAM 和 ROM 相比,两者的最大区别是 RAM 在断电以后保存在上面的数据会自动消失,而 ROM 就不会。48M 的 RAM 对于一般应用程序的运行已经足够,如果追求多媒体功能,64M 的 RAM 容量也只能够算是基本要求。相关术语:1、内存 ROM 容量 ROM(ReadOnlyMemory)的全名为唯读记忆体,它相当于 PC机上的硬盘,用来存储和保存数据。ROM 数据不能随意更新,但是在任何时候都

12、可以读取。即使是断电,ROM 也能够保留数据。但是资料一但写入后只能用特殊方法或根本无法更改,因此 ROM 常在嵌入式系统中担任存放作业系统的用途。现在市面上主流的 PDA 的 ROM大小是 64MB 以及 128MB。RAM 和 ROM 相比,两者的最大区别是 RAM 在断电以后保存在上面的数据会自动消失,而 ROM 就不会。2、FlashROM 由于 ROM 不易更改的特性让更新资料变得相当麻烦,因此就有了 FlashMemory 的发展,FlashMemory 具有 ROM 不需电力维持资料的好处,又可以在需要的时候任意更改资料,不过单价也比普通的 ROM 要高。幻灯片母版为除“标题幻灯

13、片 ”外的一组或全部幻灯片提供下列样式:“自动版式标题”的默认样式;“自动版式文本对象”的默认样式;“页脚” 的默认样式,包括:“日期时间区” 、“页脚文字区”和“页码数字区”等;统一的背景颜色或图案讲义母版提供在一张打印纸上同时打印 1、2、3 、4、6、9 张幻灯片的讲义版面布局选择设置和“页眉与页脚”的默认样式备注母版向各幻灯片添加“备注”文本的默认样式也就是说,你需要什么统一格式,只需编辑母版,该文件中的所有幻灯片都会统一应用其格式,当然你还可以每一张幻灯片再进一步修改成你所需要的效果 C/S 模式概 述C/S ( Client/Server, 客 户 机 /服 务 器 ) 模 式 又

14、 称 C/S 结 构 , 是 20 世 纪 80 年 代末 逐 步 成 长 起 来 的 一 种 模 式 , 是 软 件 系 统 体 系 结 构 的 一 种 。 C/S 结 构 的 关 键 在 于 功 能的 分 布 , 一 些 功 能 放 在 前 端 机 ( 即 客 户 机 ) 上 执 行 , 另 一 些 功 能 放 在 后 端 机 ( 即 服 务 器) 上 执 行 。 功 能 的 分 布 在 于 减 少 计 算 机 系 统 的 各 种 瓶 颈 问 题 。 C/S 模 式 简 单 地 讲 就 是基 于 企 业 内 部 网 络 的 应 用 系 统 。 与 B/S( Browser/Server,

15、浏 览 器 /服 务 器 ) 模 式 相比 , C/S 模 式 的 应 用 系 统 最 大 的 好 处 是 不 依 赖 企 业 外 网 环 境 , 即 无 论 企 业 是 否 能 够 上 网, 都 不 影 响 应 用 。 服 务 器 通 常 采 用 高 性 能 的 PC、 工 作 站 或 小 型 机 , 并 采 用 大 型 数 据 库 系 统 , 如 ORACLE、 SYBASE、 InfORMix 或 SQL Server。 客 户 端 需 要 安 装 专 用 的 客 户 端 软 件。 传 统 的 C S 体 系 结 构 虽 然 采 用 的 是 开 放 模 式 , 但 这 只 是 系 统 开

16、 发 一 级 的 开 放 性, 在 特 定 的 应 用 中 无 论 是 Client 端 还 是 Server 端 都 还 需 要 特 定 的 软 件 支 持 。 由 于 没能 提 供 用 户 真 正 期 望 的 开 放 环 境 , C/S 结 构 的 软 件 需 要 针 对 不 同 的 操 作 系 统 系 统 开 发不 同 版 本 的 软 件 , 加 之 产 品 的 更 新 换 代 十 分 快 , 已 经 很 难 适 应 百 台 电 脑 以 上 局 域 网 用户 同 时 使 用 。 而 且 代 价 高 , 效 率 低 。 如 我 院 使 用 的 上 海 超 兰 公 司 “案 件 统 计 ”管

17、 理 软件 就 是 典 型 的 C S 体 系 结 构 管 理 软 件 。 编 辑 本 段 C/S 结 构 的 优 点C/S 结 构 的 优 点 是 能 充 分 发 挥 客 户 端 的 处 理 能 力 , 很 多 工 作 可 以 在 客 户 端 处 理后 再 提 交 给 服 务 器 。 对 应 的 优 点 就 是 客 户 端 响 应 速 度 快 。 编 辑 本 段 C/S 结 构 的 缺 点缺 点 主 要 有 以 下 几 个 : 只 适 用 于 局 域 网 。而 随 着 互 联 网 的 飞 速 发 展 , 移 动 办 公 和 分 布 式 办 公 越 来 越 普 及 , 这 需 要 我 们 的

18、系 统具 有 扩 展 性 。 这 种 方 式 远 程 访 问 需 要 专 门 的 技 术 , 同 时 要 对 系 统 进 行 专 门 的 设 计 来 处 理分 布 式 的 数 据 。 客 户 端 需 要 安 装 专 用 的 客 户 端 软 件 。首 先 涉 及 到 安 装 的 工 作 量 , 其 次 任 何 一 台 电 脑 出 问 题 , 如 病 毒 、 硬 件 损 坏 , 都 需 要进 行 安 装 或 维 护 。 特 别 是 有 很 多 分 部 或 专 卖 店 的 情 况 , 不 是 工 作 量 的 问 题 , 而 是 路 程 的问 题 。 还 有 , 系 统 软 件 升 级 时 , 每 一

19、 台 客 户 机 需 要 重 新 安 装 , 其 维 护 和 升 级 成 本 非 常 高。 对 客 户 端 的 操 作 系 统 一 般 也 会 有 限 制 。可 能 适 应 于 Win98, 但 不 能 用 于 win2000 或 Windows XP。 或 者 不 适 用 于 微 软 新的 操 作 系 统 等 等 , 更 不 用 说 Linux、 nix 等 。通配符 百科名片鼠标手势器 StrokeIt 就支持标通配符通配符是一种特殊语句,主要有星号(*)和问号(?) ,用来模糊搜索文件。当查找文件夹时,可以使用它来代替一个或多个真正字符;当不知道真正字符或者懒得输入完整名字时,常常使用通

20、配符代替一个或多个真正的字符。 实际上用“*Not?paOd”可以对应 NotpadMyNotpad【*可以代表任何文字】;NotpadNotepad【? 仅代表单个文字】;NotepadNotepod【ao 代表 a 与 o 里二选一 】 ,其余以此类推。 目录隐藏一、基本概念 二、使用模式 一、基本概念 二、使用模式 编 辑 本 段 一 、 基 本 概 念通 配 符 是 一 类 键 盘 字 符 ,有 星 号 (*)和 问 号 (?). 当 查 找 文 件 夹 时 ,可 以 使 用 它 来 代 替 一 个 或 多 个 真 正 字 符 ; 当 不 知 道 真 正 字 符 或 者不 想 建 入

21、完 整 名 字 时 , 常 常 使 用 通 配 符 代 替 一 个 或 多 个 真 正 字 符 。 星 号 ( *) :可 以 使 用 星 号 代 替 0 个 或 多 个 字 符 。 如 果 正 在 查 找 以 AEW 开 头 的 一 个 文 件 , 但不 记 得 文 件 名 其 余 部 分 , 可 以 输 入 AEW*, 查 找 以 AEW 开 头 的 所 有 文 件 类 型 的 文 件, 如 AEWT.txt、 AEWU.EXE、 AEWI.dll 等 。 要 缩 小 范 围 可 以 输 入 AEW*.txt, 查 找以 AEW 开 头 的 所 有 文 件 类 型 并 .txt 为 扩 展

22、 名 的 文 件 如 AEWIP.txt、 AEWDF.txt。 问 号 ( ? ) :可 以 使 用 问 号 代 替 一 个 字 符 。 如 果 输 入 love?,查 找 以 love 开 头 的 一 个 字 符 结 尾文 件 类 型 的 文 件 , 如 lovey、 lovei 等 。 要 缩 小 范 围 可 以 输 入 love?.doc, 查 找 以 love开 头 的 一 个 字 符 结 尾 文 件 类 型 并 .doc 为 扩 展 名 的 文 件 如 lovey.doc、 loveh.doc。 通 配 符 包 括 星 号 “*”和 问 号 “? ”:星 号 表 示 匹 配 的 数

23、 量 不 受 限 制 , 而 后 者 的 匹 配 字 符 数 则 受 到 限 制 。 这 个 技 巧 主 要 用于 英 文 搜 索 中 , 如 输 入 “computer*”, 就 可 以 找 到 “computer、 computers、 computerised、 computerized”等 单 词 , 而 输 入 “comp?ter”, 则 只 能 找 到 “computer、 compater、 competer”等 单 词 。 编 辑 本 段 二 、 使 用 模 式通 配 符 优 先 级对 于 使 用 通 配 符 模 式 的 各 种 资 源 , Tivoli Access Mana

24、ger for Operating Systems 必 须 确 定 将 应 用 何 种 通 配 符 模 式 。 例 如 , 假 设 有 两 种 模 式 : /usr/local/*.log 和 /usr/local/user1/*.log 字 符 串 /usr/local/user1/x.log 与 这 两 种 模 式 都 匹 配 。 为 了 解 决 这 种 模 棱 两 可 的 情 况 , 应 用 了 优 先 级 规 则 。 模 式 越 具 体 , 其 优 先 级 也 越 高。 根 据 这 种 原 则 , /usr/local/user1/x.log 在 与 /usr/local/*.log

25、模 式 相 匹 配 之 前 先 与 /usr/local/user1/*.log 模 式 相 匹 配 。 由 于 找 到 一 个 匹 配 项 , 任 何 可 应 用 于 匹 配 此 模 式 的对 象 的 策 略 都 将 适 用 。 下 表 显 示 了 通 配 符 元 素 的 优 先 级 。 表 中 较 高 位 置 的 元 素 优 先 于 表 中 较 低 位 置 的 元 素。 表 : 通 配 符 元 素 优 先 级 规 则 优 先 级 元 素 示 例 1 精 确 字 符 a, *, 2 字 符 范 围 Aa, :digit: 3 任 意 字 符 ? 4 重 复 的 精 确 字 符 a+ 5 重

26、复 的 字 符 范 围 Aa+, :digit:+ 6 重 复 的 任 意 字 符 ?+ 7 任 意 字 符 串 * 根 据 资 源 的 种 类 , 将 通 过 从 开 始 到 结 束 ( 或 者 相 反 方 向 ) 逐 个 元 素 比 较 模 式 来 确 定优 先 级 。 匹 配 文 件 名 称 的 模 式 是 从 开 始 比 较 到 结 束 。 匹 配 主 机 名 称 的 模 式 是 从 结 束 比 较到 开 始 。 除 了 认 为 相 同 的 两 种 模 式 之 外 , 将 认 为 较 长 的 模 式 比 较 短 的 模 式 更 具 体 , 除 非 较 长的 字 符 串 是 由 于 星

27、号 ( *) 而 较 长 。 通 配 符 优 先 级 的 示 例表 4 显 示 了 按 优 先 级 从 最 高 到 最 低 排 列 的 文 件 名 和 主 机 名 通 配 符 模 式 。 表 4. 通 配 符 模 式 优 先 级 示 例 优 先 级 文 件 名 称 模 式 主 机 名 称 模 式 1 log/00-9/error www.a- 2 log/0?/error www.? 3 log/0*/error www.* 4 log/0-9+/error.1 www-help.a-z+ 5 log/*/error.1 www-help.* 6 log*/error.1 www-help.*

28、.com 7 log*/error www.*.com 8 log*/error* *www.*.com 9 log* *.com 10 * * 当 两 个 模 式 之 间 的 唯 一 差 别 是 字 符 集 合 中 指 定 的 字 符 时 , 将 通 过 逐 字 比 较 包 含 模 式的 两 个 字 符 串 来 确 定 优 先 级 。 仅 在 要 匹 配 的 字 符 集 包 含 一 些 相 同 字 符 时 才 必 须 考 虑 这 一点 。 如 果 在 两 个 集 合 中 没 有 公 共 字 符 , 则 任 一 给 定 的 字 符 串 最 多 只 能 匹 配 这 两 个 模 式 中的 一 个

29、。 路 由 配 置 中 的 通 配 符在 路 由 器 的 配 置 中 , 经 常 出 现 通 配 符 。 和 子 网 掩 码 一 样 , 都 是 以 “0”或 “1”表 示 ,不 过 与 子 网 掩 码 所 表 示 的 意 思 却 不 一 样 。 子 网 掩 码 所 表 示 的 是 IP 的 网 络 位 和 主 机 位 , 而 通 配 符 则 表 示 与 IP 是 否 匹 配 。 通 配 符 同 样 是 32 位 , 和 IP 地 址 一 一 对 应 , “0”位 代 表 精 确 匹 配 , 而 “1“位 代 表 不许 匹 配 。 例 如 路 由 器 EIGRP 的 配 置 中 : RouterA(config)#router eigrp 100 RouterA(config-router)#network 10.0.0.0 0.0.0.255 RouterA(config-router)#network 192.168.1.0 0.0.0.255 10.0.0.0 0.0.0.255 说 明 只 要 接 口 的 IP 地 址 是 以 “10”开 头 就 参 与 EIGRP 进 程 。同 理 的 , 192.168.1.0 0.0.0.255 说 明 只 要 IP 是 以 192.168.1 开 头 的 IP 就 符 合 。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。