ansj--词性说明
ansj--词性说明
背景
  Ansj 是⼀个开源的 Java 中⽂分词⼯具,基于中科院的中⽂分词算法,⽐其他常⽤的开源分词⼯具(如mmseg4j)的分词准确率更⾼。⼯具⽀持词性标注,所以就可以依据词性进⾏分词结果的过滤。ntd
词性介绍
1. 名词 (1个⼀类,7个⼆类,5个三类)
名词分为以下⼦类:
n 名词
nr ⼈名
nr1 汉语姓⽒
nr2 汉语名字
nrj ⽇语⼈名
nrf ⾳译⼈名
ns 地名
nsf ⾳译地名
nt 机构团体名
nz 其它专名
nl 名词性惯⽤语
ng 名词性语素
nw 新词
2. 时间词(1个⼀类,1个⼆类)
t 时间词
tg 时间词性语素
3. 处所词(1个⼀类)
s 处所词
4. ⽅位词(1个⼀类)
f ⽅位词
5. 动词(1个⼀类,9个⼆类)
v 动词
vd 副动词
vn 名动词
vshi 动词“是”
vyou 动词“有”
vf 趋向动词
vx 形式动词
vi 不及物动词(内动词)
vl 动词性惯⽤语
vg 动词性语素
6. 形容词(1个⼀类,4个⼆类)
a 形容词
ad 副形词
an 名形词
ag 形容词性语素
al 形容词性惯⽤语
7. 区别词(1个⼀类,2个⼆类)
b 区别词
bl 区别词性惯⽤语
8. 状态词(1个⼀类)
z 状态词
9. 代词(1个⼀类,4个⼆类,6个三类)
r 代词
rr ⼈称代词
rz 指⽰代词
rzt 时间指⽰代词
rzs 处所指⽰代词
rzv 谓词性指⽰代词
ry 疑问代词
ryt 时间疑问代词
rys 处所疑问代词
ryv 谓词性疑问代词
rg 代词性语素
10. 数词(1个⼀类,1个⼆类)
m 数词
mq 数量词
11. 量词(1个⼀类,2个⼆类)
q 量词
qv 动量词
qt 时量词
12. 副词(1个⼀类)
d 副词
13. 介词(1个⼀类,2个⼆类)
p 介词
pba 介词“把”
pbei 介词“被”
14. 连词(1个⼀类,1个⼆类)
c 连词
cc 并列连词
15. 助词(1个⼀类,15个⼆类)
u 助词
uzhe 着
ule 了喽
uguo 过
ude1 的底
ude2 地
ude3 得
usuo 所
udeng 等等等云云
uyy ⼀样⼀般似的般
udh 的话
uls 来讲来说⽽⾔说来
uzhi 之
ulian 连(“连⼩学⽣都会”)
16. 叹词(1个⼀类)
e 叹词
17. 语⽓词(1个⼀类)
y 语⽓词(delete yg)
18. 拟声词(1个⼀类)
o 拟声词
19. 前缀(1个⼀类)
h 前缀
20. 后缀(1个⼀类)
k 后缀
21. 字符串(1个⼀类,2个⼆类)
x 字符串
xx ⾮语素字
xu ⽹址URL
22. 标点符号(1个⼀类,16个⼆类)
w 标点符号
wkz 左括号,全⾓:(〔[{《【〖〈半⾓:( [ { < wky 右括号,全⾓:)〕]}》】〗〉半⾓: ) ] { > wyz 左引号,全⾓:“ ‘ 『
wyy 右引号,全⾓:” ’ 』
wj 句号,全⾓:。
ww 问号,全⾓:?半⾓:?
wt 叹号,全⾓:!半⾓:!
wd 逗号,全⾓:,半⾓:,
wf 分号,全⾓:;半⾓: ;
wn 顿号,全⾓:、
wm 冒号,全⾓::半⾓: :
ws 省略号,全⾓:…… …
wp 破折号,全⾓:—— -- ——-半⾓:— —-
wb 百分号千分号,全⾓:% ‰ 半⾓:%
wh 单位符号,全⾓:¥$£ ° ℃半⾓:$

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。