基于语义知识不等式的词嵌入

科技前沿 • 2025-03-28 18:23 • 阅读 38

大家好，我是讯享网，很高兴认识大家。

文献：Liu Q, Jiang H, Wei S, et al. Learning Semantic Word Embeddings based on Ordinal Knowledge Constraints[C]. ACL 2015: 1501-1511.

Motivation

1）纯数据驱动的SWE有可能使得一些反义词之间的距离比同义词之间的距离还要小；2）语料库的不完备（语义相近的一对词却在数据中较少共现）可能使得无法准确捕捉近义词对间的关系。

基本思想

将语义知识表示成条件不等式，从而可将SWE形式化条件最优问题。

构造语义不等式的规则

同义反义规则: sim(wi,wj)>sim(wi,wk) , wi 与 wj 是同义词， wi 与 wk 是反义词.

讯享网
语义类别规则: 在wordnet、freebase等语义知识库中，处于同一语义类别中的词语间具有更大相似度.
语义层次规则

语义不等式与skip-gram模型相结合

这里写图片描述

Q=1T∑t=1T∑−c⩽j⩽c,j≠0logp(wt+j|wt) ，其中 t 为目标词.
{ W(1),W(2)}=argmaxW(1),W(2)Q(W(1),W(2))

将所有的语义不等式 sij>sik,∀(i,j,k)∈S 转化为 D=∑(i,j,k)∈Sf(i,j,k) ，从而可将skip-gram模型中的Q函数转变为 Q′=Q−β⋅D ,其中 f(i,j,k) 可以用不同的规范函数来实现。例如:sigmoid函数 f(i,j,k)=1/(1+exp(sij−sik)) 或者 hinge函数 f(i,j,k)=max(δ,sij−sik)

基于语义知识不等式的词嵌入

Motivation

基本思想

构造语义不等式的规则

语义不等式与skip-gram模型相结合

相关推荐