1、 跨象乘云大数据分析平台使用手册目录集群管理 .2数据管理 .10查看文件 .11上传文件 .12删除文件 .13Hive 表管理 .15查看表 .15创建表 .16删除表 .19查询表 .19HBase 表管理 .21查看表 .21创建表 .22删除表 .23禁用表 .23添加数据 .23查询表 .24NBA 投篮分析 .24集群管理1. 登录服务器 IP:7180 端口,使用账户登录,即可看到如下界面此页面展示了所有已启动的服务以及集群的性能监控信息2. 点击顶部“主机” 菜单,即可看到集群中所有的主机信息这里,我们可以看到所有的节 点信息以及它上面所拥有的角色和它的状 态等信息。3. 然
2、后,我们点击“Parcel”这里我们可以下载某些包,对 我们的环境或某个服务进行升 级。4. 点击状态下的 YARN 可以看到yarn 是 hadoop2.x 中引入的,在上面可以运行 MR 以及其他的服务。5. YARN 的 web ui 提供了两个图形界面,首先,我们看下 jobHistoryUI,如下:这个就是 MR 默认的 job 运行记录6. 再来看看 resourceManagerUI这个是 YARN 提供的 application 运行记录7. 在状态下点击 HBase 可以看到:我们可以在状态摘要看到,hbase 安装后拥有的服务。同时,也可以通过此图形化界面进行一些相关的配置
3、。8. 接下来我们看看 table statistic这里展示了 hbase 中表的统计信息。9. 然后,我们看看 hbase web ui,地址为服务器 IP:60010我们可以看到表的列族等信息。10. 在状态下点击 HDFS 可以看到:我们可以看到 hdfs 的容量状况,读写的情况11. 我们进入主节点 NameNode,可以浏览 hdfs 中的文件信息,地址为服务器 IP:5007012. 在状态下点击 Hive 可以看到:13. 在状态下点击 Impala 可以看到:impala 与 hive 的区别,一个是在内存中运算,用于 实时查询,另一个是启动 MR 运算,用于离线查询。进入 impala,可以看到:另外,我们可以点击查询,可以看到我们在 impala-shell 执行过的所有命令,如下: