博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
CS224N研究热点2_Linear Algebraic Structure of Word Senses, with Applications to Polysemy(对于一词多义的向量表示研究)
阅读量:4211 次
发布时间:2019-05-26

本文共 910 字,大约阅读时间需要 3 分钟。

Paper:Linear Algebraic Structure of Word Senses, with Applications to Polysemy

词向量编码的相似性
相似的单词的词向量编码在欧几里得空间中的分布会彼此相邻:

如何表示多义词?

比如,tie在游戏比赛的平局;在衣服中的领带;或者表示一种扭曲的动作。

实际得到的tie的词向量是tie-1、tie-2、tie-3所有的线性叠加,映射到二维平面上处于中间:

如何复原每种词义?

采用一种稀疏编码的算法可以简单地解决这个问题。

其中,AiAi是每个词义项对应的上下文向量,αiαi是其权重,ηη是噪音项。

通过稀疏编码,可以将词义项恢复和区分:

观察输出项,可以看到有些与衣服有关,有些和运动有关。有趣的是,同时可以看到音乐类的输出。

如何进行评估?

找一群研究生,询问这些单词哪一个对应tie,然后与算法结果进行对比。

结果显示,这种算法的结果与调查的非本地研究生的结果差不多。以英语为母语的人在这项任务上做的更好。

总结

词向量可以捕捉多义性
词向量是多义向量的线性叠加
可以通过稀疏编码恢复多义向量,进行语境解释
这种恢复可以达到non-native English Speaker的水平
--------------------- 

个人理解笔记:

之前采用word2vec等方法可以得到词的编码(描述) 其中包含词的相似性等信息 有显示意义  。但接下的问题是  一词可以有多义   那么这种多义和我们得到的词向量有着怎样的联系  我们如何求得某种语境下的词向量呢

Linear Algebraic Structure of Word Senses, with Applications to Polysemy
这篇文章从一种角度描述了这种关系

此图中  tie是我们可以通过语料库 预训练得到的词向量 

其与义项的关系可以描述为

也就是一种线性表达   Ai就表示特定语境下的词向量表示  ai是权重   

现在要求解A  其实就是要找到一组基向量  使得其线性组合满足V

转换成一个数学上的稀疏编码问题

然后描绘图上  可以看到其在哪几种词分类中  也就表示有多少不同意思

 

转载地址:http://bxumi.baihongyu.com/

你可能感兴趣的文章
【一天一道LeetCode】#60. Permutation Sequence.
查看>>
【一天一道LeetCode】#113. Path Sum II
查看>>
【一天一道LeetCode】#114. Flatten Binary Tree to Linked List
查看>>
【unix网络编程第三版】阅读笔记(二):套接字编程简介
查看>>
【一天一道LeetCode】#115. Distinct Subsequences
查看>>
【一天一道LeetCode】#116. Populating Next Right Pointers in Each Node
查看>>
【一天一道LeetCode】#118. Pascal's Triangle
查看>>
JNI简介及实例
查看>>
JAVA实现文件树
查看>>
linux -8 Linux磁盘与文件系统的管理
查看>>
linux 9 -文件系统的压缩与打包 -dump
查看>>
ebay api - GetUserDisputes 函数
查看>>
ebay api GetMyMessages 函数
查看>>
手动12 - 安装php加速器 Zend OPcache
查看>>
set theme -yii2
查看>>
yii2 - 模块(modules)的view 映射到theme里面
查看>>
yii2 - controller
查看>>
yii2 - 增加actions
查看>>
php图像处理函数大全(缩放、剪裁、缩放、翻转、旋转、透明、锐化的实例总结)
查看>>
magento url中 uenc 一坨编码 base64
查看>>