文档帮助中心文档
从标记化的文档数组、单词包模型或n-gram包模型中删除空文档
newDocuments = removeEmptyDocuments(文档)
newBag = removeEmptyDocuments(袋)
[___idx] = removeEmptyDocuments (___)
例子
newDocuments= removeEmptyDocuments (文档)删除没有字的文档文档.
newDocuments= removeEmptyDocuments (文档)
newDocuments
文档
newBag= removeEmptyDocuments (袋)从单词袋或n-g袋模型中删除没有单词或n-g的文档袋.
newBag= removeEmptyDocuments (袋)
newBag
袋
[___,idx) = removeEmptyDocuments (___)还返回已删除文档的索引。
[___,idx) = removeEmptyDocuments (___)
idx
全部折叠
从标记化文档数组中删除不包含单词的文档。
创建一个包含空文档的令牌化文档数组。
文件= tokenizedDocument ([一个短句的例子""第二个短句""])
documents = 4x1 tokenizedDocument: 6 tokens:一个短句0 tokens的示例:4 tokens:第二个短句0 tokens:
删除空文档。
newDocuments = 2x1 tokenizedDocument: 6个令牌:一个短句的例子4个令牌:第二个短句
从单词袋模型中删除不包含单词的文档。
从标记化文档数组创建单词袋模型。
文件= tokenizedDocument ([“一个短句的例子。”""第二个简短的句子。""]);袋= bagOfWords(文档)
单词:["An" "a" "short"…NumWords: 9 NumDocuments: 4
从单词袋模型中删除空文档。
newBag = bagOfWords with properties: Counts: [2x9 double] newBag = bagOfWords with properties: Counts: [2x9 double]NumWords: 9 NumDocuments: 2
从数组中删除不包含单词的文档,并使用删除文档的索引来删除相应的标签。
创建一个标签向量。
标签= [“T”;“F”;“F”;“T”]
标签=4 x1字符串" t " " f " " f " " t "
删除空文档并获取删除文档的索引。
[newDocuments, idx] = removeEmptyDocuments(documents)
idx =2×12 4
取下对应的标签标签.
标签
标签(idx) = []
标签=2 x1字符串“T”“F”
tokenizedDocument
输入文档,指定为tokenizedDocument数组中。
bagOfWords
bagOfNgrams
输入bag-of-words或bag-of-n-grams模型,指定为bagOfWords对象或一个bagOfNgrams对象。
输出文档,作为tokenizedDocument数组中。
输出模型,作为bagOfWords对象或一个bagOfNgrams对象。的类型newBag是同类型的吗袋.
已删除文档的索引,作为正整数向量返回。
bagOfWords|bagOfNgrams|addDocument|removeDocument|tokenizedDocument
addDocument
removeDocument
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系