postgresql中正则的简单介绍

请问一下PostgreSQL什么意思请详述谢谢

首先知道substring函数在PostgreSQL中的作用。在这段SQ语句中，substring是使用的substring(txt from reg)的形式，其中, txt是要进行正则匹配的源字符串，reg是匹配的正则表达式。如此，我们大概可以知道：这段代码的then其实就是用information进行一些正则表达式的匹配，然后获取匹配后的那段字符串。

成都创新互联主要从事成都网站制作、网站设计、网页设计、企业做网站、公司建网站等业务。立足成都服务山东,十载网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:18980820575

这段代码中一共有3个substring函数调用，而执行的顺序则与它们出现的顺序相反，首先执行的是:

substring(information from E':step_1: \\*([0 -9]+)' )

它获得匹配step_1: *后面所跟的数字；假设information为:step_1: *1234a, 那么获得的就是1234；

接下来为第二substring, 它是用information来匹配上面获得的数字嵌入":"和".*:step_1:"的那段内容；

而最后一个substring，则是匹配第二个获得的字串，其中前为“loan_purpose: ”接下来为非换行符号的那部分字串(即获得以“loan_purpose: ”开始的所有非换行字符，遇到换行符就终止，不包括"loan_purpose: ")。

一个例子:

select substring( substring( information FROM': ' || substring(information from E':step_1:

\\*([0-9]+)'

) ||'.*:step_1:')

from E'loan_purpose: ([^\n]+)')

from (select 'start here: 1234loan_purpose: Hello World:step_1: *1234end'::character varying as information)

运行结果如图，

postgresql怎么匹配正则表达式

在postgresql中使用正则表达式时需要使用关键字“~”，以表示该关键字之前的内容需匹配之后的正则表达式，若匹配规则不需要区分大小写，可以使用组合关键字“~*”；

相反，若需要查询不匹配这则表达式的记录，只需在该关键字前加否定关键字“！”即可。若正则表达式包含转义字符，则需在表达式前加关键字“E”。

PostgreSQL全文检索简介

PostgreSQL自带有一个简易的全文检索引擎，可以实现小规模数据量的全文检索功能。本文我们将引导介绍一下这个功能，对于小数据量的搜索这个功能是足够使用的，而无需搭建额外的ES等重量级的全文检索服务器。

PG的全文检索操作符是 @@ ，当一个 tsvector (文档)和 tsquery (条件)匹配时返回 true ，并且前后顺序无影响:

和普通的SQL查询一样，只要在 WHERE 条件中使用这个符号就代表使用全文检索条件筛选文档了。如:

@@ 操作符支持隐式转换，对于 text 类型可以无需强类型转换( ::tsvector 或 to_tsvector(config_name, text) )，所以这个操作符实际支持的参数类型是这样的:

tsquery 查询条件并不是简单的正则，而是一组搜索术语，使用并且使用布尔操作符（AND）、 | （OR）和 ! （NOT）来组合它们，还有短语搜索操作符 - （FOLLOWED BY）。更详细的语法参见此文档。

此外，PostgreSQL还提供了两个相对简化的版本 plainto_tsquery 和 phraseto_tsquery 。

plainto_tsquery ( plainto_tsquery([ config regconfig, ] querytext text) returns tsquery )用户将未格式化的 text 经过分词之后，插入符号转为 tsquery :

phraseto_tsquery ( phraseto_tsquery([ config regconfig, ] querytext text) returns tsquery )行为和 plainto_tsquery 行为类似，但是分词之后不是插入而是 - (FOLLOWED BY):

使用索引可以加快全文检索的速度。对于全文检索来说，可选的索引类型是 GIN (通用倒排索引)和 GIST (通用搜索树)，官方文档更推荐使用 GIN索引。创建一个 GIN 索引的范例:

也可以是一个连接列:

还可以单独创建一个 tsvector 列，为这个列创建索引:

除了普通的 ORDER BY 条件之外，PostgreSQL为全文检索提供了两个可选的排序函数 ts_rank([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 和 ts_rank_cd([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 ，以便实现基于权重的排序。

此外，对于PostgreSQL 9.6以上的版本还可以使用 RUM index 排序。(注意，这个是扩展，默认不包含)。

PostgreSQL默认的分词字典中并不包含中文分词字典，因此我们必须手工引入。目前一个比较好的项目是 zhparser ，同时这个插件也是阿里云的RDS默认包含的。安装和启用没什么好说的。值得一提的是分词配置参数。

在 CREATE EXTENSION 之后，必须配置分词参数才能正确进行分词和查找，否则什么都查不到。官方文档提供的一个配置策略是:

n,v,a,i,e,l 这几个字母分别表示一种token策略，只启用了这几种token mapping，其余则被屏蔽。具体支持的参数和含义可以用 \dFp+ zhparser 显示:

WITH simple 表示词典使用的是内置的simple词典，即仅做小写转换。根据需要可以灵活定义词典和token映射，以实现屏蔽词和同义词归并等功能。

比如我们看下面这个例子:

可以看到江淮这个词组在查询的时候被忽略了，我们启用 j (abbreviation,简称)再看看结果:

所以实际使用中要设置合理的token types，过少将导致搜索结果不准确，过多将导致性能下降。此外，还有一些诸如短词复合: zhparser.multi_short = f 这一类的控制分词结果的选项，根据实际使用酌情开启。

本文名称：postgresql中正则的简单介绍
浏览路径：http://mswzjz.cn/article/dscooss.html

网站建设知识

postgresql中正则的简单介绍

请问一下PostgreSQL什么意思请详述谢谢

postgresql怎么匹配正则表达式

PostgreSQL全文检索简介

其他资讯

网站建设知识

postgresql中正则的简单介绍

请问一下PostgreSQL什么意思 请详述 谢谢

postgresql怎么匹配正则表达式

PostgreSQL全文检索简介

其他资讯

请问一下PostgreSQL什么意思请详述谢谢