针对加载HDFS 文件支持NameNode 高可用的情况,在执行加载语句前,需
要首先设置gbase_hdfs_namenodes='acitve_nn, standby_nn',指定HDFS 的高
可用NameNode 主机信息。
(HDFS 通常由两个NameNode 和若干DataNode
组成,
其中一个NameNode 处于Active 状态,
另外一个处于Standby 状态。
)
示例:
在执行加载语句前,对支持高可用的HDFS,设置系统参数。
gbase> set gbase_hdfs_namenodes="192.168.10.1,192.168.10.2";
用户输入加载语句,指定加载HDFS 文件,在URL 中指定了正确的HDFS
的NameNode 主机名(或IP 地址)和端口号。
gbase> LOAD DATA INFILE 'hdp://hadoop@192.168.10.1:50070/data/test.tbl' INTO TABLE
test.t;
注:如上示例,目前兼容工具支持对/data/test.tbl 部分特殊字符转义,支持文
件名包含以下特殊字符:
' '(空格), '!', '"', '#', '$', '%', '&', "'", '(', ')', '+', '-', '.', ':', ';', '<', '=', '>', '@', '[', '\', ']', '^',
'_', '`', '{', '|', '}', '~'
GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1192
不支持以下特殊字符转义:
通配符:'*'、'?'
路径分隔符:'/'
不支持以下特殊字符组合:'%('、' ;'(空格和分号),'\[','\]'
特殊字符'\'在配置文件中须写为'\\'
多hadoop 集群并行导入和导出:
多套HDFS 环境需要从集群并行导入导出时,设置gbase_hdfs_namenodes 参
数为多套HDFS 的NameNode 组之间使用'|'分隔
gbase_hdfs_namenodes='hdfs1_acitve_nn, hdfs1_standby_nn | hdfs2_acitve_nn,
hdfs2_standby_nn '
gbase_hdfs_namenodes='192.168.1.1,192.168.1.2|192.168.2.1,192.168.2.2'
load data infile 'hdp://gbase@192.168.1.1/data/f.tbl' into table test.t
load data infile 'hdp://gbase@192.168.2.1/data/f.tbl' into table test.t