返回首页

gbase数据、南大通用产品文档:GBase8c使用gsql 元命令导入数据

更新日期:2024年09月11日

gsql 工具提供了元命令\copy 进行数据导入。
\COPY 命令
\copy 命令格式以及说明参见表9-5 \copy 元命令说明。
表9-5 \copy 元命令说明
语法
说明
\copy { table [ ( column_list ) ] |
( query ) } { from | to } { filename
|
stdin
|
stdout
|
pstdin
|
pstdout }[ with
] [
binary
]
在gsql 客户端登录数据库成功后,可以使用该命令进
行数据的导入/导出操作。
但是与SQL 的COPY 命令不
同,
该命令读取/ 写入的文件是本地文件,
而非数据库
服务器端文件;所以,要操作的文件的可访问性、权

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
315
[ delimiter [ as ] 'character' ]
[ null [ as ] 'string' ] [ csv
[
header
]
[
quote
[
as
]
'character' ]
[ escape
[
as
]
'character'
]
[
force
quote
column_list | * ] [ force not null
column_list ] ]
限等,都是受限于本地用户的权限。
说明:\COPY 只适合小批量、格式良好的数据导入场
景,不会对非法字符做预处理,也无容错能力,无法
适用于含有异常数据的场景。导入数据应优先选择
COPY。
参数说明

table
表的名称(可以有模式修饰)。取值范围:已存在的表名。

column_list
可选的待拷贝字段列表。
取值范围:任意字段。如果没有声明字段列表,将使用所有字段。

query
其结果将被拷贝。
取值范围:一个必须用圆括弧包围的SELECT 或VALUES 命令。

filename
文件的绝对路径。执行copy 命令的用户必须有此路径的写权限。

stdin
声明输入是来自标准输入。

stdout
声明输出打印到标准输出。

pstdin
声明输入是来自gsql 的标准输入。

pstout
声明输出打印到gsql 的标准输出。

binary
使用二进制格式存储和读取,而不是以文本的方式。在二进制模式下,不能声明

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
316
DELIMITER,NULL,CSV 选项。指定binary 类型后,不能再通过option 或copy_option 指
定CSV、FIXED、TEXT 等类型。

delimiter [ as ] 'character'
指定数据文件行数据的字段分隔符。

分隔符不能是\r 和\n。

分隔符不能和null 参数相同,CSV 格式数据的分隔符不能和quote 参数相同。

TEXT 格式数据的分隔符不能包含:\.abcdefghijklmnopqrstuvwxyz0123456789。

数据文件中单行数据长度需<1GB,如果分隔符较长且数据列较多的情况下,会影
响导出有效数据的长度。

分隔符推荐使用多字符和不可见字符。多字符例如'$^&';不可见字符例如0x07,
0x08,0x1b 等。
取值范围:支持多字符分隔符,但分隔符不能超过10 个字节。默认值:

TEXT 格式的默认分隔符是水平制表符(tab)。

CSV 格式的默认分隔符为“,”。

FIXED 格式没有分隔符。

null [ as ] 'string'
用来指定数据文件中空值的表示。取值范围:

null 值不能是\r 和\n,最大为100 个字符。

null 值不能和分隔符、quote 参数相同。默认值:

CSV 格式下默认值是一个没有引号的空字符串。

在TEXT 格式下默认值是\N。

header
指定导出数据文件是否包含标题行,标题行一般用来描述表中每个字段的信息。
header 只能用于CSV,FIXED 格式的文件中。
在导入数据时,如果header 选项为on,则数据文本第一行会被识别为标题行,会忽略
此行。如果header 为off,而数据文件中第一行会被识别为数据。

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
317
在导出数据时,如果header 选项为on,则需要指定fileheader。fileheader 是指定导出数
据包含标题行的定义文件。如果header 为off,则导出数据文件不包含标题行。
取值范围:true/on,false/off。默认值:false

quote [ as ] 'character'
CSV 格式文件下的引号字符。默认值:双引号。

quote 参数不能和分隔符、null 参数相同。

quote 参数只能是单字节的字符。

推荐不可见字符作为quote,例如0x07,0x08,0x1b 等。

escape [ as ] 'character'
CSV 格式下,用来指定逃逸字符,逃逸字符只能指定为单字节字符。默认值:双引号。
当与quote 值相同时,会被替换为'\0'。

force quote column_list | *
在CSV COPY TO 模式下,
强制在每个声明的字段周围对所有非NULL 值都使用引号包
围。NULL 输出不会被引号包围。
取值范围:已存在的字段。

force not null column_list
在CSV COPY FROM 模式下,指定的字段输入不能为空。取值范围:已存在的字段。
任务示例
(1)
创建目标表a。
postgres=# CREATE TABLE a(a int);
(2)
导入数据。
1
从stdin 拷贝数据到目标表a。
postgres=# \copy a from stdin;
出现>>符号提示时,输入数据,输入\.时结束
Enter data to be copied followed by a newline.
End with a backslash and a period on a line by itself.
>> 1

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
318
>> 2
>> \.
查询导入目标表a 的数据。
postgres=# SELECT * FROM a;
a
---
1
2
(2 rows)
2
从本地文件拷贝数据到目标表a。假设存在本地文件/home/gbase/2.csv。

分隔符为‘,’。

在导入过程中,若数据源文件比外表定义的列数多,则忽略行尾多出来的列。
postgres=# \copy a FROM '/home/gbase/2.csv' WITH (delimiter',',IGNORE_EXTRA_DATA
'on');

uncontrolled_memory_context
参数说明:启用检查内存上下文是否超过给定限制的功能时,设置不受此功能约束。仅
适用于DEBUG 版本。
该参数属于USERSET 类型参数,请参考表15-1 中对应设置方法进行设置。
查询时会在参数值的最前面添加标题含义字符串“MemoryContext white list:”。
取值范围:字符串
默认值:空

GBase 8c V5 开发者手册
南大通用数据技术股份有限公司
1175

引用完整性指的是表之间的关系。由于数据库中每一表都必须具有主键,因此此主键可出
现在其他的表中,这是因为它与那些表内数据的关系。当来自一个表的主键出现在另一表
中时,将它称之为外键。
外键连接表并在表之间创建依赖。若干表可形成依赖的层级结构,这样,如果您更改或删
除一个表中的行,则您破坏在其他表中行的含义。例如,下图展示 customer 表
的 customer_num 列是那个表的主键,以及 orders 和 cust_call 表中的外键。
在 orders 和 cust_calls 表中都引用客户编号 106,George Watson™。如果从 customer 表删除
客户 106,则破坏三个表以及此特定的客户之间的链接。
图: 演示数据库中的引用完整性



GBase 8s SQL 指南:教程
南大通用数据技术股份有限公司
- 185 -

当您删除包含主键的行,或以不同的主键更新它时,您破坏了包含那个值作为外键的任何
行的含义。引用完整性是外键对主键的逻辑依赖。包含外键的行的完整性依赖于它引用的
那行的完整性—包含相匹配的主键的行。
在缺省情况下,数据库服务器不允许您违反引用完整性,且如果在您从子表删除行之前,
您尝试从父表删除行,则向您提示错误消息。然而,您可使用 ON DELETE CASCADE 选
项来在从父表删除的同时对相应的子表进行删除。请参阅 ON DELETE CASCADE 选项。
要定义主键和外键以及它们之间的关系,请使用 CREATE TABLE 和 ALTER TABLE 语
句。要获取关于这些语句的更多信息,请参阅《GBase 8s SQL 指南:语法》。要获取关于
如何构建带有主键和外键的数据模型,请参阅《GBase 8s 数据库设计和实现指南》。

ON DELETE CASCADE 选项
当您从主键为表删除行时,要保持引用完整性,请使用 CREATE TABLE 和 ALTER
TABLE 语句的 REFERENCES 子句中的 ON DELETE CASCADE 选项。此选项允许您使
用单个删除命令从父表删除一行以及在相匹配的子表中它的对应行。
在级联删除期间锁定
在删除期间,保持父表和子表上的所有符合条件的行上的锁定。当您指定删除时,在执行
任何引用操作之前,执行从父表请求的删除。
多个子表的情况
如果您具有带有两个子约束的父表,
一个子表指定了级联删除,
另一个子表没有级联删除,
且您尝试从同时应用于两个子表的父表删除一行,
则 DELETE 语句失败,
且从父表和子表
都不删除行。
必须打开日志记录
为了使级联删除起作用,您必须在您的当前数据库中打开日志记录。在 事务日志记录 中讨
论日志记录和级联删除。

级联删除的示例
假设您有应用了引用完整性规则的两个表,父表 accounts,以及子表 sub_accounts。下列
CREATE TABLE 语句定义引用约束:
CREATE TABLE accounts (
acc_num SERIAL primary key,
acc_type INT,
acc_descr CHAR(20));


GBase 8s SQL 指南:教程
南大通用数据技术股份有限公司
- 186 -
CREATE TABLE sub_accounts (
sub_acc INTEGER primary key,
ref_num INTEGER REFERENCES accounts (acc_num)
ON DELETE CASCADE,
sub_descr CHAR(20));
accounts 表的主键,acc_num 列,使用 SERIAL 数据类型,sub_accounts 表的外键,
ref_num 列,
使用 INTEGER 数据类型。
允许组合主键上的 SERIAL 与外键上的 INTEGER
数据类型。仅在此条件下,您可混合并匹配数据类型。SERIAL 数据类型是 INTEGER,且
数据库自动地为该列生成值。所有其他主键与外键组合都必须显式地相匹配。例如,定义
为 CHAR 的主键必须与定义为 CHAR 的外键相匹配。
sub_accounts 表的外键的定义,ref_num 列,包括 ON DELETE CASCADE 选项。此选项指
定在父表 accounts 中任何行的删除都将自动地导致删除子表 sub_accounts 的对应行。
要从将级联删除 sub_accounts 表的 accounts 表删除一行,您必须打开日志记录。打开日志
记录之后,您可从两个表都删除账户编号 2,如下例所示:
DELETE FROM accounts WHERE acc_num = 2;

对级联删除的限制
对于大多数删除,包括自引用的删除和循环查询的删除,您可使用级联删除。唯一的例外
是相关的子查询,相关的子查询是嵌套的 SELECT 语句,子查询(或内部 SELECT)在
其中产生的值依赖于包含它的外部 SELECT 语句所产生的值。如果您已实施了级联删除,
则您不可在相关的子查询中编写使用子表的删除。当您尝试从相关的子查询删除时,您会
收到错误。
限制: 如果表使用 ON DELETE CASCADE 定义引用约束,则您不可在该表上定义 DELETE
触发器事件。