单词嵌入模型,将单词映射到向量并返回
单词嵌入是由word2vec、GloVe和fastText库推广的,它将词汇表中的单词映射到真实的向量。
这些向量试图捕捉单词的语义,以便相似的单词有相似的向量。一些嵌入词还能捕捉单词之间的关系,比如“国王之于王后,正如男人之于女人".在向量形式中,这个关系是国王-男人+女人=王后.
创建一个词嵌入通过加载预先训练的嵌入使用fastTextWordEmbedding
,从文件中读取嵌入readWordEmbedding
,或通过使用训练嵌入trainWordEmbedding
.
vec2word |
映射嵌入向量到word |
word2vec |
将单词映射到嵌入向量 |
isVocabularyWord |
测试word是否为word嵌入或编码的成员 |
writeWordEmbedding |
写字嵌入文件 |
fastTextWordEmbedding
|doc2sequence
|wordEmbeddingLayer
|wordEncoding
|word2vec
|vec2word
|trainWordEmbedding
|tokenizedDocument