返回首页

gbase数据、南大通用产品文档:GBase8c

更新日期:2024年09月11日

查看数据

使用系统表pg_tables 查询数据库所有表的信息。
postgres=# SELECT * FROM pg_tables;

使用gsql 的\d+命令查询表的属性。
postgres=# \d+ customer_t1;

执行如下命令查询表customer_t1 的数据量。
postgres=# SELECT count(*) FROM customer_t1;

执行如下命令查询表customer_t1 的所有数据。
postgres=# SELECT * FROM customer_t1;

执行如下命令只查询字段c_customer_sk 的数据。
postgres=# SELECT c_customer_sk FROM customer_t1;

执行如下命令过滤字段c_customer_sk 的重复数据。
postgres=# SELECT DISTINCT( c_customer_sk ) FROM customer_t1;

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
29

执行如下命令查询字段c_customer_sk 为3869 的所有数据。
postgres=# SELECT * FROM customer_t1 WHERE c_customer_sk = 3869;

执行如下命令按照字段c_customer_sk 进行排序。
postgres=# SELECT * FROM customer_t1 ORDER BY c_customer_sk;

功能说明
GBase 8a MPP Cluster 提供数据导出功能,即把数据导出到8a 集群的服务器端,
也支持将集群数据导出到Hadoop 集群上或kafka 集群上。导出到8a 集群服务器
上和Hadoop 集群上时支持导出为文本文件或gz/snappy/lzo 格式压缩文件;导出
到kafka 集群中为记录的文本形式。
SELECT...INTO OUTFILE...支持导出复杂SQL 语句的查询结果。
查询结果导出为
HDFS 文件时支持NameNode 高可用。
语法格式
SELECT…INTO OUTFILE 'file_path' [OUTFILE_OPTION] FROM…;
SELECT…FROM…INTO OUTFILE 'file_path' [OUTFILE_OPTION];
表5- 154 参数说明
字段名称
含义说明
file_path
保存导出数据的路径及文件名。
OUTFILE_OPTION
数据导出的规则。
表5- 155 OUTFILE_OPTION 参数说明
OUTFILE_OPTION
选项


FIELDS/COLUMNS
TERMINATED BY
字段分隔符,支持多个字符,最大支持字符数为10。如果不
指定分隔符则默认值“\t”,即TAB 键。
FIELDS/COLUMNS
[OPTIONALLY]
ENCLOSED BY
字段包围符,可以自行指定单个字符为字段包围符,指定多
个字符时报错。
支持OPTIONALLY 选项,加OPTIONALLY 选项时仅对字
符串类型起作用,否则对所有字段都起作用。
默认为无字段包围符。
FIELDS/COLUMNS
ESCAPED BY
转义标识符,可以自行指定单个字符为转义标识符,指定多
个字符时报错,默认为“\”,默认值在语句中写为:FIELDS
ESCAPED BY '\\'。
LINES TERMINATED
BY
行分隔符,支持多个字符,最大支持字符数为10。默认为
“\n”。
LINES STARTING BY
行起始符,
支持多个字符,
最大支持字符数为10。
默认为空。
FIELDS/COLUMNS
字段包含符自转义,该参数包含上面参数(字段包围符)的

GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1217
OUTFILE_OPTION
选项


[OPTIONALLY]
DOUBLE_ENCLOSED
BY
所有功能;但额外的作用是,当转义符设置为空时,如果某
字段满足使用字段包围符的条件,且该字段中还有与字段包
围符相同的字符,则将该字符通过双写的方式自转义。
NULL_VALUE
空值标识符,支持多个字符,最大支持字符数为32。默认为
“\N”。
OUTFILEMODE BY
导出方式,可选值为:LOCAL 或HDFS。
LOCAL:导出本地文件,HDFS:导出HDFS 文件。
默认为LOCAL 方式导出。
WRITEMODE BY
写入方式,可选值为:NORMAL 或OVERWRITES。
NORMAL:如果文件已存在则报错,OVERWRITES 覆盖已
存在的文件。
默认为NORMAL 方式写入。
FILECOUNT
并行导出的文件个数,最小值为0,最大值为UINT_MAX
(4294967295),默认值为0,表示不限制文件导出个数。
仅对导出HDFS 文件有效。
在不指定FILESIZE 参数时,实际导出HDFS 文件个数为
FILECOUNT 和数据主分片数二者的最小值。
当使用默认值时,每个主分片导出为一个HDFS 文件。
FILESIZE
导出文件大小的最大值,最小值为0,最大值为
ULONGLONG_MAX(18446744073709551615),默认值为0,
表示不限制导出文件的大小。如导出文件大小大于此参数
值,则分裂产生新文件。新文件命名方式为
file_title+suffix+file_ext 形式,
其中file_title 是file_name 中’.’
之前的部分,file_ext 为file_name 中’.’之后的部分(包含’.’)
suffix 为自动追加的文件名后缀,
第一个文件名后缀是“_p1”,
以此类推。FILESIZE 值支持k/K/m/M/g/G 后缀表示方式。
CHARACTER SET
指定导出文件的字符集,支持GBK 和UTF8 编码,默认导
出和源表字符集保持一致。
FIELDS/COLUMNS
LENGTH
在使用定长模式导出时,用于设定字段长度的参数。定长格
式数据导出时,设置每个字段的长度,多个字段之间用逗号
分隔,该参数不能和列分隔符以及包围符混用。
WITH HEAD
可选参数,用户输入该参数时,表示本地导出数据文件带有
表头信息。用户忽略该参数时,表示本地导出数据文件不带
表头信息。
WITH HEAD 语法约束:

对于表头导出功能,当用户指定转义字符时,表
头信息不作转义处理;

导出表头信息默认为小写,如果导出表头需要区











_gcluster_support_outfile_with_table_head_case_se
nsitive
默认值为0,
功能关闭,
导出表头均转为小写;


GBase 8a MPP Cluster 产品手册
5 数据库管理指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
1218
OUTFILE_OPTION
选项


置值为1,功能开启,导出表头信息区分大小写

表头的导出只支持express 引擎表,
其他类型不作
保证;

PG_EXTENSION_DATA_SOURCE 系统表存储外部数据源对象的信息。一个外部数据
源对象(Data Source)包含了外部数据库的一些口令编码等信息,主要配合Extension
Connector 使用。
名称
类型
引用
描述
oid
oid
-
行标识符(隐含属性,必须明确选
择)。
srcname
name
-
外部数据源对象的名称。
srcowner
oid
PG_AUTHID.o
id
外部数据源对象的所有者。
srctype
text
-
外部数据源对象的类型,缺省为空。
srcversion
text
-
外部数据源对象的版本,缺省为空。
srcacl
aclitem[]
-
访问权限。

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
785
名称
类型
引用
描述
srcoptions
text[]
-
外部数据源对象的指定选项,使用“k
eyword=value”格式的字符串。