主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

모델링및예측

토픽모델과단어임베딩을사용하여예측모델개발

LSA, LDA단어임베딩같은머신러닝기법과모델을사용하여고차원텍스트데이터셋에서군집을찾고특징을추출할수있습니다。文本分析工具箱™에서생성한특징은다른데이터소스의특징과결합할수있습니다。결합된특징을사용하여텍스트,숫자등다양한유형의데이터를활용하는머신러닝모델을빌드할수있습니다。

함수

모두확장

bagOfWords Bag-of-words모델
bagOfNgrams Bag-of-n-grams모델
addDocument bag-of-words모델또는bag-of-n-grams모델에문서추가
removeDocument bag-of-words모델또는bag-of-n-grams모델에서문서제거
removeInfrequentWords bag-of-words모델에서개수가적은단어제거
removeInfrequentNgrams bag-of-n-grams모델에서낮은빈도로나오는语法제거
removeWords 문서또는bag-of-words모델에서선택한단어제거
removeNgrams bag-of-n-grams모델에서语法제거
removeEmptyDocuments 토큰화된문서배열,bag-of-words모델또는bag-of-n-grams모델에서빈문서제거
topkwords 单词袋模型或LDA主题中最重要的单词
topkngrams 最常见的字格
编码 문서를단어개수또는语法개수로구성된행렬로인코딩
tfidf 术语频率-反文档频率(tf-idf)矩阵
加入 组合多个bag-of-words或bag-of-n-grams模型
vaderSentimentScores VADER算法的情感评分
ratioSentimentScores 使用比率规则进行情感评分
fastTextWordEmbedding 사전훈련된fastText단어임베딩
wordEncoding 单词编码模型,将单词映射到索引和返回
doc2sequence 将文档转换为深度学习的序列
wordEmbeddingLayer 딥러닝신경망을위한단어임베딩계층
word2vec 단어를임베딩벡터에매핑하기
word2ind 단어를인코딩인덱스에매핑하기
vec2word 임베딩벡터를단어에매핑
ind2word 将编码索引映射到word
isVocabularyWord 단어가단어임베딩또는인코딩에포함되었는지테스트
readWordEmbedding 파일에서단어임베딩읽어오기
trainWordEmbedding 火车字嵌入
writeWordEmbedding 단어임베딩파일쓰기
wordEmbedding 단어를벡터로매핑하는단어임베딩모델
extractSummary 문서에서요약추출
rakeKeywords 使用RAKE提取关键词
textrankKeywords 使用TextRank提取关键字
bleuEvaluationScore 使用BLEU相似度评分评估翻译或摘要
rougeEvaluationScore 使用ROUGE相似度评分评估翻译或摘要
bm25Similarity 文档与BM25算法的相似性
cosineSimilarity 文档相似度与余弦相似度
textrankScores TextRank알고리즘을사용하여문서점수화
lexrankScores 使用LexRank算法对文档进行评分
mmrScores 基于最大边际相关性(MMR)算法的文档评分
fitlda 拟合潜在狄利克雷分配(LDA)模型
fitlsa 符合LSA模型
的简历 恢复拟合LDA模型
logp LDA模型的文件对数概率和拟合优度
预测 预测文档的顶级LDA主题
变换 将文档转换为低维空间
ldaModel 潜在狄利克雷分配(LDA)模型
lsaModel 潜在语义分析(LSA)模型
wordcloud 从文本、词袋模型、词袋-n-grams模型或LDA模型创建词云图
textscatter 文本的二维散点图
textscatter3 文本的三维散点图

도움말항목

분류및모델링

단순전처리함수만들기

이예제에서는분석할텍스트데이터를정리하고전처리하는함수를만드는방법을보여줍니다。

분류를위한간단한텍스트모델만들기

이예제에서는bag-of-words모델을사용하여단어빈도수로간단한텍스트분류기를훈련시키는방법을보여줍니다。

다단어구문을사용하여텍스트데이터분석하기

이예제에서는语法빈도수를사용하여텍스트를분석하는방법을보여줍니다。

토픽모델을사용하여텍스트데이터분석하기

이예제에서는LDA(잠재디리클레할당)토픽모델을사용하여텍스트데이터를분석하는방법을보여줍니다。

LDA모델의토픽수선택하기

이예제에서는LDA(잠재디리클레할당)모델에적합한토픽수를결정하는방법을보여줍니다。

比较LDA解决者

这个例子展示了如何通过比较模型的拟合优度和拟合时间来比较潜在的Dirichlet分配(LDA)求解器。

감성분석및키워드추출

텍스트에내포된감성분석하기

이예제에서는维达(价知道字典和情绪)中寻欢알고리즘을사용하여감성분석을수행하는방법을보여줍니다。

生成领域特定情感词典

这个例子展示了如何使用10-K和10-Q财务报告生成情感分析的词典。

训练情感分类器

这个例子展示了如何使用带注释的正面和负面情感词列表和预先训练的词嵌入来训练情感分析分类器。

利用RAKE从文本数据中提取关键字

这个例子展示了如何使用快速自动关键字提取(RAKE)从文本数据中提取关键字。

使用TextRank从文本数据中提取关键词

这个例子展示了如何使用TextRank从文本数据中提取关键字。

딥러닝

딥러닝을사용하여텍스트데이터분류하기

이예제에서는딥러닝장단기기억(LSTM)신경망을사용하여텍스트데이터를분류하는방법을보여줍니다。

基于卷积神经网络的文本数据分类

这个例子展示了如何使用卷积神经网络对文本数据进行分类。

使用深度学习对内存不足的文本数据进行分类

这个例子展示了如何用深度学习网络使用转换后的数据存储对内存不足的文本数据进行分类。

使用注意的顺序翻译

这个示例演示了如何使用循环序列到序列编码器-解码器模型将十进制字符串转换为罗马数字。

딥러닝을사용하여텍스트생성하기(深度学习工具箱)

이예제에서는텍스트를생성하도록딥러닝장단기기억(LSTM)신경망을훈련시키는방법을보여줍니다。

오만과편견그리고MATLAB

이예제에서는문자임베딩을사용하여텍스트를생성하도록딥러닝LSTM신경망을훈련시키는방법을보여줍니다。

使用深度学习逐字生成文本

这个例子展示了如何训练一个深度学习LSTM网络来逐字生成文本。

使用自定义训练循环对文本数据进行分类

这个例子展示了如何使用带有自定义训练循环的深度学习双向长短期记忆(BiLSTM)网络对文本数据进行分类。

使用自动编码器生成文本

这个例子展示了如何使用自动编码器生成文本数据。

定义文本编码器模型函数

这个例子展示了如何定义一个文本编码器模型函数。

텍스트디코더모델함수정의하기

이예제에서는텍스트디코더모델함수를정의하는방법을보여줍니다。

언어지원

언어고려사항

다른언어에서文本分析工具箱기능을사용하는방법에대한정보。

日本语言支持金宝app

关于文本分析工具箱中的日语支持的信息。金宝app

分析日语文本数据

这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。

德国语言支持金宝app

关于文本分析工具箱中的德语支持的信息。金宝app

分析德语文本数据

这个示例展示了如何使用主题模型导入、准备和分析德语文本数据。

추천예제