postgresql分词_PostgreSQL使⽤zhparser⾃定义分词Zhparser是pg的⼀个中⽂全⽂检索插件,它基于简单中⽂分词(SCWS)实现中⽂解析器。
例如:
bill=# SELECT * FROM ts_parse('zhparser', '⽀付宝使⽤很⽅便');
tokid | token
-------+-------
118 | ⽀付
110 | 宝不到打印机
肖战最新消息118 | 使⽤
100 | 很
118 | ⽅便
(5 rows)
上⾯这⼀句话中,默认的分词词库中⽆法识别“⽀付宝”这个词语,于是将它切成了“⽀付”和“宝”两个词,显然这不是我们希望看到的。那么我们要怎么重新⾃定义词库呢?
成都好玩的地方有哪些bill=# insert into zhparser.zhprs_custom_word values('⽀付宝');
四叶草的寓意INSERT 0 1
bill=# select sync_zhprs_custom_word();
sync_zhprs_custom_word
------------------------
(1 row)
办港澳通行证需要什么证件bill=# SELECT * FROM ts_parse('zhparser', '⽀付宝使⽤很⽅便');
tokid | token
-------+--------
120 | ⽀付宝
汽车后备箱118 | 使⽤
100 | 很
118 | ⽅便
(4 rows)
可以看到我们已经将“⽀付宝”这个词语加⼊到我们⾃定义的词库中了!
版权声明:本⽂为博主原创⽂章,未经博主允许不得转载。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论