BTM主题模型构建及困惑度计算--慧智精品网

BTM主题模型构建及困惑度计算

def perplexity(argvs):

宋小宝2013电视剧prob_sum = 0#p(b)

model_dir = argvs[1]#模型的存储路径我又想要你了真的想你了

K = int(argvs[2])#主题个数

voca_pt = argvs[3]#词汇-id对应表路径

test_corpus = argvs[4]#测试集路径

voca = read_voca(voca_pt)#以字典形式存储词汇id

W = len(voca)#词汇个数

pz_pt = model_dir + 'k%d.pz' % K#主题概率的存储路径

pz = read_pz(pz_pt)

zw_pt = model_dir + 'k%d.pw_z' % K#主题词汇概率分布的存储路径

k = 0

topics = []

for l in open(zw_pt):

app1 = {}#以字典形式存储主题下词汇与其对应的概率值

vs = [float(v) for v in l.split()]形容雪

wvs = zip(range(len(vs)), vs)

wvs = sorted(wvs, key=lambda d:d[1], reverse=True)

for w,v in wvs:

app1[voca[w]] = v

topics.append((pz[k], app1))#存储到列表：主题-词汇-概率

print(topics)

k += 1

广州高考成绩查询bs = cidui(test_corpus)#获取测试集中的词对

count = 0#词对计数

for bi in bs:

prob_bi = 0

count += 1

w1 = bi.get_wi()延禧攻略一共多少集

w2 = bi.get_wj()

for i in range(len(topics)):#计算p(b)

prob_topic = topics[i][0]

prob_w1 = topics[i][1][voca[w1]]

prob_w2 = topics[i][1][voca[w2]]

prob_bi += prob_topic*prob_w1*prob_w2

prob_sum += math.log(prob_bi)

prep = p(-prob_sum/count)

廷禧攻略

return prep

结合github中给出的代码，代码能⼒很弱，有没有⼈跟我讨论下⾥⾯的细节。

发表评论

慧智精品网

BTM主题模型构建及困惑度计算

发表评论

推荐文章

【精品】人教版三年级数学下册期末复习知识点总结

会务人员工作总结范文(通用13篇)

关于战友情的演讲稿

关于对志愿军的描写和赞扬的作文100字

中考历史

热门文章

建党100周年是哪一年?

建军节回顾中国军队的伟大成就

建军节纪念中国人民解放军成立的日子

重温建军历程建军节回顾中国军队的奋斗历史

建军节庆祝中国军队的辉煌成就

建军节专题回顾中国军队的历史辉煌与伟大成就

建军节回顾中国军队的辉煌历史

纪念建军节见证中国国防事业的伟大成就与发展

纪念建军节回顾中国军队的辉煌历史与发展成就

八一建军节的历史背景

为热烈庆祝建军96周年

建军节相关知识和历史故事

2019年11月1日是建军多少周年

八一建军节的来历和由来

三年级数学下拓展题

...建设世界一流军队——热烈庆祝中国人民解放军建军90 周年

2021年是中国人民解放军建军多少周年

考研政治-建军90周意味着哪些政治考点

介绍建军96周年伟大成就和历史功勋

幼儿园大班基本知识100个常识

最新文章

关于对志愿军的描写和赞扬的作文100字

胡绳《中国共产党的七十年》配套模拟试题及详解【圣才出品】_百度文 ...

传媒从业者必备:2014年新闻月历

2023年全民国防教育知识网络竞赛考试模拟卷

人教版数学三年级上册 7单元(年月日)练习题

关于建军节的事迹简短100字

标签列表