欢迎光临
我们一直在努力

使用HBase自带的import工具导入数据遇到的两个问题

因为开发环境需要迁移,将原来HBase中的表使用 org.apache.hadoop.hbase.mapreduce.Export 工具序列化到hdfs后下载出来,在新的开发环境中导入。导入时遇到了两个问题。

问题一:导入失败提示User hbase cannot submit applications to queue root.hbase

解决方法:

登录到yarn集群管理节点Resource Manager机器上/etc/hadoop 路径 ,修改fair-scheduler.xml 

vi /etc/hadoop/fair-scheduler.xml,新增以下内容(所有的Resource Manager节点都需要修改),保存退出。不需要重启集群和组件

<queue name='hbase'>
  <weight>1</weight>
  <schedulingPolicy>drf</schedulingPolicy>
  <aclSubmitApps>hdfs,hbase,hive</aclSubmitApps>
  <aclAdministerApps>hbase</aclAdministerApps>
  <minResources>100 mb,10 vcores</minResources>
  <maxResources>10240 mb,50 vcores</maxResources>
  <maxRunningApps>50</maxRunningApps> 
</queue>


问题二:导入失败,终端没有按正常进度走,也没有相关错误提示。

查看yarn 中的job日志发现如下信息

解决方法:

去系统下查看hbaseiduid=482(hbase)yarn的配置中有一项为“min.user.id”最小用户id这里配置了1000。修改为300后问题排除。

这个配置的作用是允许的最小 Linux 用户 ID。用于阻止其他超级用户。

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。