1、ARM 公司推出三维图形系统解决方案当 今 的 移 动 和 消 费 设 备 都 具 有 复 杂 的 图 形 用 户 界 面 , 而 且 很 多 还 集 成 了 游 戏 功 能 。 这 导 致越 来 越 高 的 性 能 和 功 能 要 求 , 同 时 要 求 更 低 的 成 本 和 功 耗 。 来 自 ARM 公 司 的 ARM Mali系 列 图 形 IP 核 专 门 设 计 用 于 满 足 移 动 设 备 中 高 性 能 二 维 (2D)和 三 维 (3D)图 形 的 市 场 需 求 。ARM Mali 产 品 通 过 那 些 服 务 于 移 动 电 话 和 PDA 制 造 商 、 移 动
2、游 戏 机 供 应 商 和 汽 车 行 业的 信 息 娱 乐 系 统 制 造 商 的 系 统 集 成 商 和 SoC 供 应 商 集 成 到 终 端 用 户 设 备 中 ; 而 所 有 这 些领 域 都 需 要 成 熟 的 图 形 功 能 。 Mali200 像 素 处 理 器 和 MaliGP2 几 何 处 理 器 最 新 的 ARM Mali 图 形 解 决 方 案 由 ARM Mali200 像 素 处 理 器 和 MaliGP2 可 编 程 几 何 处 理器 组 成 。 它 们 共 同 组 成 了 一 个 完 整 的 OpenGL ES2.0 可 编 程 图 形 解 决 方 案 。 一
3、 直 以 来 , 3D 图 形 加 速 器 都 需 要 非 常 高 的 存 储 器 带 宽 。 Mali 系 列 通 过 使 用 小 片 渲 染 方 案来 最 小 化 存 储 器 带 宽 。 小 片 渲 染 也 称 为 延 迟 渲 染 , 因 为 渲 染 被 延 迟 到 多 边 形 (三 角 形 )的 一个 完 整 帧 准 备 好 渲 染 才 开 始 。 小 片 方 案 将 屏 幕 划 分 成 若 干 小 片 , 一 次 一 个 小 片 地 渲 染 到 片上 的 小 片 存 储 器 , 这 意 味 着 采 用 传 统 渲 染 器 时 许 多 需 要 片 外 实 现 的 存 储 器 访 问 在
4、使 用Mali 核 时 可 以 保 持 在 片 上 实 现 。 由 于 片 外 存 储 器 读 取 比 片 上 存 储 器 读 取 需 要 的 功 耗 高 一 个数 量 级 , 因 此 这 样 做 有 助 于 降 低 功 耗 , 对 于 要 求 长 电 池 寿 命 的 移 动 设 备 来 说 这 是 很 关 键 的 。小 片 渲 染 方 法 的 一 个 缺 点 是 成 本 , 与 简 单 的 “直 接 模 式 ”渲 染 器 相 比 , 增 加 的 复 杂 性 将 导 致更 高 的 逻 辑 门 数 , 并 导 致 更 大 的 硅 片 面 积 和 更 高 的 成 本 。 Mali 系 列 使 用
5、小 片 渲 染 和 传 统的 “直 接 模 式 ”渲 染 结 合 的 独 特 方 式 , 因 此 能 同 时 实 现 存 储 器 带 宽 和 成 本 /面 积 的 最 小 化 ,并 使 Mali 内 核 远 小 于 竞 争 性 的 移 动 小 片 渲 染 器 。 Mali 系 列 是 由 Mali55、 新 的 Mali200 和 MaliGP2 组 成 , 前 者 实 现 了 OpenGL ES 1.1 固定 功 能 渲 染 API, 而 Mali200 和 MaliGP2 一 起 实 现 了 OpenGL ES 1.1 API 和 OpenGL ES 2.0 可 编 程 API。 Open
6、GL ES 2.0 API 通 过 一 个 可 替 代 OpenGL EX1.1 中 固 定 功 能 管线 的 可 编 程 渲 染 管 线 提 供 显 著 的 灵 活 性 和 高 质 量 。 因 此 只 需 很 少 量 的 多 边 形 就 可 实 现 很 高的 质 量 , 从 而 不 仅 最 小 化 了 存 储 器 带 宽 , 而 且 最 大 化 了 图 形 质 量 。 Mali55 内 核 可 以 从 前 向 光 栅 实 现 OpenGL ES 1.1 管 线 。 Mali200 也 是 从 前 向 光 栅 实 现OpenGL ES 2.0 管 线 级 。 MaliGP2 则 实 现 了 图
7、 形 管 线 的 Vertex Shader 部 分 。 就 像OpenGL ES 一 样 , Mali 内 核 还 能 实 现 其 它 的 API, 例 如 微 软 的 DirectX Mobile。 图 1: OpenGL ES 1.x 固 定 功 能 流 水 线 示 意 图 。 图 2: OpenGL ES 2.0 可 编 程 流 水 线 示 意 图 。 图 3: 利 用 全 屏 抗 锯 齿 功 能 提 高 图 像 质 量 。 图 像 质 量 、 系 统 集 成 和 数 据 流 为 了 充 分 利 用 移 动 电 话 、 PDA 和 移 动 GPS 设 备 的 小 型 显 示 器 , M
8、ali 内 核 提 供 了 全 屏 反锯 齿 (FSAA)功 能 。 FSAA 可 以 减 少 锯 齿 状 图 形 , 从 而 改 善 图 像 质 量 。 Mali 内 核 使 用 了 一种 正 在 申 请 专 利 的 技 术 , 这 种 技 术 能 实 现 4 倍 的 反 锯 齿 效 果 , 而 对 存 储 器 带 宽 以 及 帧 速率 几 乎 没 有 影 响 , 尽 管 可 以 实 现 16 倍 的 反 锯 齿 , 但 是 会 在 一 定 程 度 上 增 加 带 宽 并 降 低 帧速 率 。 Mali 图 形 内 核 针 对 统 一 存 储 器 架 构 进 行 了 优 化 , 在 这 种
9、架 构 中 , 单 个 存 储 器 子 系 统 可 在 主处 理 器 和 图 形 加 速 器 之 间 共 享 。 Mali 内 核 的 主 系 统 接 口 是 AMBA 3 AX 主 机 接 口 。 AMBA 2 APB 接 口 用 于 编 程 片 上 寄 存 器 。 对 Mali 寄 存 器 的 访 问 量 很 少 , 因 为 每 个 帧 的 全 部 图 形处 理 命 令 集 中 在 存 储 器 内 , 最 多 只 有 存 储 器 中 的 命 令 基 地 址 需 要 重 新 编 程 到 寄 存 器 内 。 需 要 显 示 的 图 形 对 象 被 分 割 成 许 多 列 三 角 形 , 这 些
10、 三 角 形 由 三 个 用 X、 Y 和 Z 空 间 坐 标给 出 的 顶 点 组 成 。 针 对 MaliGP2 的 顶 点 和 命 令 由 ARM 处 理 器 写 入 到 存 储 器 中 。MaliGP2 对 命 令 和 顶 点 进 行 处 理 , 将 处 理 后 的 顶 点 写 回 到 主 存 储 器 中 (在 Mali55 中 , 这是 由 优 化 的 软 件 来 处 理 的 )。 然 后 由 Mali200 对 三 角 形 进 行 光 栅 化 处 理 -从 主 存 储 器 中 读 取顶 点 和 命 令 , 一 次 对 一 个 小 片 进 行 渲 染 。 经 光 栅 化 处 理 (或
11、 渲 染 过 )的 小 片 被 写 入 到 存 储 器中 , 然 后 由 LCD 或 VGA 控 制 器 读 取 和 显 示 。 因 为 Mali 内 核 具 有 延 迟 渲 染 特 点 , 因 此 在ARM 内 核 和 MaliGP2 之 间 以 及 在 MaliGP 和 Mali200 之 间 的 管 线 是 以 一 个 帧 为 基 础 -产生 一 个 完 整 的 数 据 帧 , 并 存 储 到 管 线 流 中 每 个 器 件 之 间 的 主 存 储 器 中 。 与 竞 争 方 案 相 比 , Mali 图 形 内 核 需 要 较 小 的 存 储 器 带 宽 , 但 是 存 储 器 系 统
12、 带 宽 依 然 很 重要 。 Mali 内 核 设 计 成 与 主 处 理 器 共 享 SDRAM。 当 前 的 SDRAM 器 件 具 有 较 高 的 时 钟 速度 以 及 较 高 的 理 论 最 大 带 宽 , 但 是 延 迟 时 间 较 长 。 Mali 内 核 设 计 成 与 SDRAM 一 起 工 作 。来 自 Mali 内 核 的 事 务 大 多 数 是 4 个 字 或 8 个 字 串 。 3D 图 形 引 擎 不 同 于 通 用 的 处 理 器 ,各 个 存 储 器 访 问 之 间 几 乎 没 有 依 赖 性 。 在 前 一 个 像 素 的 数 据 返 回 之 前 , 可 以
13、开 始 另 外 一 个像 素 的 存 储 器 事 务 , 因 为 它 们 之 间 没 有 依 赖 性 。 这 样 , 3D 内 核 可 以 发 起 多 个 未 结 束 的 事务 。 ARM AMBA 3 AXI 非 常 适 合 于 图 形 内 核 , 因 为 它 支 持 多 个 未 结 束 的 事 务 。 SDRAM 和 PL111 彩 色 LCD/VGA 控 制 器 ARM PrimeCell PL340 SDRAM 控 制 器 支 持 SDR 和 DDR 存 储 器 , 包 括 移 动 和 低 功 耗 类产 品 , 这 些 产 品 分 别 具 有 时 钟 速 度 高 达 166MHz 的
14、16、 32 和 64 比 特 的 总 线 。 典 型 的 移动 设 备 需 要 使 用 16 比 特 或 32 比 特 、 时 钟 速 度 在 200 和 166MHz 之 间 (200 到 333MHz数 据 率 )的 移 动 型 DDR。 对 于 更 高 性 能 的 系 统 , ARM PrimeCell PL341 DDR SDRAM控 制 器 可 以 支 持 时 钟 速 率 高 达 400MHz(800MHz 数 据 速 率 )的 DDR 。 为 使 方 案 更 加 完善 , ARM(由 其 Artisan 物 理 IP 部 门 )还 提 供 DDR 和 DDR 板 以 及 实 现
15、完 整 DDR 物 理 接口 (PHY)所 需 的 PLL 和 DLL。 Mali 渲 染 引 擎 (Mali200 和 Mali55)对 即 将 由 LCD 或 视 频 控 制 器 显 示 的 图 形 进 行 渲 染 , 并存 储 到 存 储 器 的 帧 缓 存 中 。 ARM PrimeCell PL111 彩 色 LCD 控 制 器 支 持 高 达1,0241,024 分 辨 率 的 监 视 器 或 LCD 平 面 显 示 器 。 除 了 有 源 TFT LCD 外 , 它 还 支 持 老式 的 单 面 板 或 双 面 板 STN LCD 显 示 器 。 软 件 驱 动 程 序 与 Ma
16、li 内 核 一 起 提 供 的 还 有 针 对 OpenGL ES2.0、 OpenGL ES1.1(为 了 兼 容 固 定 功 能API)和 OpenVG 矢 量 图 形 API 的 驱 动 程 序 。 获 得 许 可 的 人 可 以 收 到 他 们 所 选 操 作 系 统(Linux、 Symbian 或 Windows Mobile)的 驱 动 程 序 , 也 可 以 获 得 针 对 其 它 操 作 系 统 的 驱 动程 序 组 (需 要 另 外 付 费 )。 除 了 OpenGL ES 外 , DirectX Mobile API 也 将 在 微 软 的Windows Mobile
17、上 得 到 支 持 。 本 文 小 结 ARM Mali 产 品 为 当 前 的 移 动 手 持 设 备 提 供 了 完 整 二 维 和 三 维 图 形 以 及 视 频 解 决 方 案 的 基础 。 低 存 储 器 带 宽 使 得 Mali 解 决 方 案 非 常 适 合 移 动 设 备 使 用 。 但 是 完 整 的 图 形 解 决 方 案光 靠 一 个 3D 内 核 是 不 够 的 , ARM 提 供 了 一 个 完 整 的 系 统 解 决 方 案 : 软 件 驱 动 程 序 、 在上 面 运 行 软 件 的 处 理 器 、 AMBA 3 AXI 互 联 架 构 、 高 吞 吐 量 SDRAM 控 制 器 以 及LCD/VGA 视 频 控 制 器 。 这 些 产 品 综 合 在 一 起 为 当 今 的 高 级 移 动 设 备 和 嵌 入 式 设 备 提 供 了一 个 完 整 的 低 功 耗 高 性 能 的 2D 和 3D 图 形 解 决 方 案 。 作 者 : Ashley Stevens 解 决 方 案 营 销 经 理 ARM 公 司