主要内容

fasttextwordembeddings.

佩带的FastText Word嵌入

描述

例子

胚胎= fasttextwordembeddings.返回嵌入100万英语单词的300维净化词。

此功能需要Text Analytics Toolbox™模型对于FastText英语160亿令牌字嵌入金宝app支持包。如果未安装此支持金宝app包,则该函数提供了下载链接。

例子

全部收缩

下载并安装文本分析工具箱模型对于FastText英语160亿令牌字嵌入金宝app支持包。

类型fasttextwordembeddings.在命令行。

fasttextwordembeddings.

如果是文本分析工具箱模型对于FastText英语160亿令牌字嵌入金宝app不安装支持包,然后该函数提供了在附加资源管理器中的所需支持包的链接。要安装支持包,请单击“链接”,金宝app然后单击安装。通过键入检查安装是否成功emb = fasttextwordembeddings.在命令行。

emb = fasttextwordembeddings.
emb = wordembeddings与属性:维度:300词汇:[1×1000000字符串]

如果安装了所需的支持包,则该函数金宝app返回aWordembeddings.目的。

加载嵌入使用的预磨词fasttextwordembeddings.。此功能需要文本分析工具箱™模型对于FastText英语160亿令牌字嵌入金宝app支持包。如果未安装此支持金宝app包,则该函数提供了下载链接。

emb = fasttextwordembeddings.
emb = wordembeddings与属性:维度:300词汇:[1×1000000字符串]

用“意大利”,“罗马”和“巴黎”来映射使用Word2vec.

意大利= word2vec(emb,“意大利”);罗马= word2vec(emb,“罗马”);巴黎= Word2Vec(emb,“巴黎”);

映射矢量意大利 - 罗马+巴黎使用一个单词vec2word.

Word = vec2word(emb,意大利 - 罗马+巴黎)
Word =“法国”

将一系列令牌化文件转换为使用佩带的单词嵌入的单词向量序列。

使用使用的倒置的Word嵌入倒置的单词fasttextwordembeddings.功能。此功能需要文本分析工具箱™模型对于FastText英语160亿令牌字嵌入金宝app支持包。如果未安装此支持金宝app包,则该函数提供了下载链接。

emb = fasttextwordembedding;

加载出厂报告数据并创建一个令人畏缩的鳕文大批。

filename =.“factoryreports.csv”;数据= readtable(文件名,'texttype''细绳');textdata = data.description;文档= tokenizeddocument(textdata);

将文档转换为使用单词向量的序列doc2sequence.。这doc2sequence.默认情况下,默认情况下,序列具有相同的长度。使用高维文字嵌入转换大量文件时,填充可能需要大量的内存。要防止功能填充数据,请设置'paddingdirection'选择'没有任何'。或者,您可以使用使用的填充量'长度'选项。

序列= doc2sequence(mem,文件,'paddingdirection''没有任何');

查看前10个序列的大小。每个序列都是D.-经过-S.矩阵,其中D.是嵌入的维度,和S.是序列中的单词矢量的数量。

序列(1:10)
ans =.10×1个单元阵列{300×10单} {300×11单} {300×11单} {300×5单} {300×10单} {300×8单} {300×9单} {300×7单} {300×13单}

输出参数

全部收缩

倒置的单词嵌入,作为一个返回Wordembeddings.目的。

在R2018A介绍