返回首页

gbase数据、南大通用产品文档:GBase8a重命名虚拟集群

更新日期:2024年09月11日

功能
更改现有VC 的名称。
语法
gcadmin renamevc
表4- 26 参数说明

GBase 8a MPP Cluster 产品手册
4 管理员指南
文档版本953(2022-09-15)
南大通用数据技术股份有限公司
195
参数名称
说明
old_vc_name
修改前的vc 名称。
new_vc_name
修改后的vc 名称。

GBase 8c ADO. NET 是 一 款 提 供 . NET 应 用 程 序 与 GBase 8c
数 据 库
之 间 方 便 、

效 、 安 全

互 的 接
口 程 序 , 开 发 人 员 可
以 使
用 任 何
一 种 .NET 开
发 语 言 (C#、VB. NET、F#)
通 过 GBase
8c AD0. NET 操
作 GBase
数 据 库 。
GBase 8c AD0. NET 支 持 以 下 特 性 :
1.
支 持 集 群 负 载 均 衡 功 能 ;
南 大 通 用 数 据 技 术 股 份 有 限 公 司
39

2. 支
持 GBase
数 据 库 全 部 特 性 ,
如 : 视
图 等 ;
3.
支 持 肚 ndows
平 台

的 TCP/IP 套 接 字 连 接 ;
4. 支
持 Linux 平
台 下 的 TCP/IP 套
接 字 或 Linux 套 接 字 连 接 ;
5.
无 需 安 装 GBase 数 据 库 的 客 户 端 , 可 通 过 GBase 8c AD0. NET 类 库 实 现 完 整 的 管 理 功

tag
XML tag

entity
XML entity
&
blank
Space symbols
(any whitespace or punctuation not
otherwise recognized)
注意:
对于解析器来说,
一个“字母”的概念是由数据库的语言区域设置,
即lc_ctype
设置决定的。只包含基本ASCII 字母的词被报告为一个单独的token 类型,因为这类词
有时需要被区分出来。大多数欧洲语言中,对token 类型word 和asciiword 的处理方法
是类似的。
email 不支持某些由RFC 5322 定义的有效电子邮件字符。具体来说,可用于email
用户名的非字母数字字符仅包含句号、破折号和下划线。
解析器可能对同一内容进行重叠token。例如,包含连字符的单词将作为一个整体
进行报告,其组件也会分别被报告:
gbase=#SELECT alias, description, token FROM
ts_debug('english','foo-bar-beta1');
alias
|
description
|
token
-----------------+------------------------------------------+---------------
numhword
| Hyphenated word, letters and digits
| foo-bar-beta1
hword_asciipart | Hyphenated word part, all ASCII
| foo
blank
| Space symbols
| -

GBase 8c SQL 参考手册
南大通用数据技术股份有限公司
649
hword_asciipart | Hyphenated word part, all ASCII
| bar
blank
| Space symbols
| -
hword_numpart
| Hyphenated word part, letters and digits | beta1
这种行为是有必要的,因为它支持搜索整个复合词和各组件。这里是另一个例子:
gbase=#SELECT alias, description, token FROM
ts_debug('english','http://example.com/stuff/index.html');
alias
|
description
|
token
----------+---------------+------------------------------
protocol | Protocol head | http://
url
| URL
| example.com/stuff/index.html
host
| Host
| example.com
url_path | URL path
| /stuff/index.html
N-gram 是一种机械分词方法,适用于无语义中文分词场景。N-gram 分词法可以保证分
词的完备性,
但是为了照顾所有可能,
把很多不必要的词也加入到索引中,
导致索引项增加。
N-gram 支持中文编码包括GBK、UTF-8。内置6 种token 类型,如下表所示。
表8-2 token 类型
别名
描述
zh_words
chinese words
en_word
english word
numeric
numeric data
alnum
alnum string
grapsymbol
graphic symbol
multisymbol
multiple symbol
Pound 是一种固定格式分词方法,适用于无语意但待解析文本以固定分隔符分割开来
的中英文分词场景。支持中文编码包括GBK、UTF8,支持英文编码包括ASCII。内置6 种
token 类型,如表8-3 所示;支持5 种分隔符,如表8-4 所示,在用户不进行自定义设置的
情况下分隔符默认为“#”
。Pound 限制单个token 长度不能超过256 个字符。

GBase 8c SQL 参考手册
南大通用数据技术股份有限公司
650
表8-3 token 类型
别名
描述
zh_words
chinese words
en_word
english word
numeric
numeric data
alnum
alnum string
grapsymbol
graphic symbol
multisymbol
multiple symbol
表8-4 分隔符类型
分隔符
描述
@
Special character
#
Special character
$
Special character
%
Special character
/
Special character