문서 도움말센터문서

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

모델링및예측

토픽모델과단어임베딩을사용하여예측모델개발

LSA, LDA단어임베딩같은머신러닝기법과모델을사용하여고차원텍스트데이터셋에서군집을찾고특징을추출할수있습니다。文本分析工具箱™에서생성한특징은다른데이터소스의특징과결합할수있습니다。결합된특징을사용하여텍스트,숫자등다양한유형의데이터를활용하는머신러닝모델을빌드할수있습니다。

함수

단어및语法개수세기

`bagOfWords`	Bag-of-words모델
`bagOfNgrams`	Bag-of-n-grams모델
`addDocument`	bag-of-words모델또는bag-of-n-grams모델에문서추가
`removeDocument`	bag-of-words모델또는bag-of-n-grams모델에서문서제거
`removeInfrequentWords`	bag-of-words모델에서개수가적은단어제거
`removeInfrequentNgrams`	bag-of-n-grams모델에서낮은빈도로나오는语法제거
`removeWords`	문서또는bag-of-words모델에서선택한단어제거
`removeNgrams`	bag-of-n-grams모델에서语法제거
`removeEmptyDocuments`	토큰화된문서배열,bag-of-words모델또는bag-of-n-grams모델에서빈문서제거
`topkwords`	单词袋模型或LDA主题中最重要的单词
`topkngrams`	最常见的字格
`编码`	문서를단어개수또는语法개수로구성된행렬로인코딩
`tfidf`	术语频率-反文档频率(tf-idf)矩阵
`加入`	组合多个bag-of-words或bag-of-n-grams模型

감성분석

`vaderSentimentScores`	VADER算法的情感评分
`ratioSentimentScores`	使用比率规则进行情感评分

단어임베딩및인코딩

`fastTextWordEmbedding`	사전훈련된fastText단어임베딩
`wordEncoding`	单词编码模型，将单词映射到索引和返回
`doc2sequence`	将文档转换为深度学习的序列
`wordEmbeddingLayer`	딥러닝신경망을위한단어임베딩계층
`word2vec`	단어를임베딩벡터에매핑하기
`word2ind`	단어를인코딩인덱스에매핑하기
`vec2word`	임베딩벡터를단어에매핑
`ind2word`	将编码索引映射到word
`isVocabularyWord`	단어가단어임베딩또는인코딩에포함되었는지테스트
`readWordEmbedding`	파일에서단어임베딩읽어오기
`trainWordEmbedding`	火车字嵌入
`writeWordEmbedding`	단어임베딩파일쓰기
`wordEmbedding`	단어를벡터로매핑하는단어임베딩모델

문서요약및유사성

`extractSummary`	문서에서요약추출
`rakeKeywords`	使用RAKE提取关键词
`textrankKeywords`	使用TextRank提取关键字
`bleuEvaluationScore`	使用BLEU相似度评分评估翻译或摘要
`rougeEvaluationScore`	使用ROUGE相似度评分评估翻译或摘要
`bm25Similarity`	文档与BM25算法的相似性
`cosineSimilarity`	文档相似度与余弦相似度
`textrankScores`	TextRank알고리즘을사용하여문서점수화
`lexrankScores`	使用LexRank算法对文档进行评分
`mmrScores`	基于最大边际相关性(MMR)算法的文档评分

토픽모델링및차원축소

`fitlda`	拟合潜在狄利克雷分配(LDA)模型
`fitlsa`	符合LSA模型
`的简历`	恢复拟合LDA模型
`logp`	LDA模型的文件对数概率和拟合优度
`预测`	预测文档的顶级LDA主题
`变换`	将文档转换为低维空间
`ldaModel`	潜在狄利克雷分配(LDA)模型
`lsaModel`	潜在语义分析(LSA)模型

시각화

`wordcloud`	从文本、词袋模型、词袋-n-grams模型或LDA模型创建词云图
`textscatter`	文本的二维散点图
`textscatter3`	文本的三维散点图

도움말항목

분류및모델링

단순전처리함수만들기

이예제에서는분석할텍스트데이터를정리하고전처리하는함수를만드는방법을보여줍니다。

분류를위한간단한텍스트모델만들기

이예제에서는bag-of-words모델을사용하여단어빈도수로간단한텍스트분류기를훈련시키는방법을보여줍니다。

다단어구문을사용하여텍스트데이터분석하기

이예제에서는语法빈도수를사용하여텍스트를분석하는방법을보여줍니다。

토픽모델을사용하여텍스트데이터분석하기

이예제에서는LDA(잠재디리클레할당)토픽모델을사용하여텍스트데이터를분석하는방법을보여줍니다。

LDA모델의토픽수선택하기

이예제에서는LDA(잠재디리클레할당)모델에적합한토픽수를결정하는방법을보여줍니다。

比较LDA解决者

这个例子展示了如何通过比较模型的拟合优度和拟合时间来比较潜在的Dirichlet分配(LDA)求解器。

감성분석및키워드추출

텍스트에내포된감성분석하기

이예제에서는维达(价知道字典和情绪)中寻欢알고리즘을사용하여감성분석을수행하는방법을보여줍니다。

生成领域特定情感词典

这个例子展示了如何使用10-K和10-Q财务报告生成情感分析的词典。

训练情感分类器

这个例子展示了如何使用带注释的正面和负面情感词列表和预先训练的词嵌入来训练情感分析分类器。

利用RAKE从文本数据中提取关键字

这个例子展示了如何使用快速自动关键字提取(RAKE)从文本数据中提取关键字。

使用TextRank从文本数据中提取关键词

这个例子展示了如何使用TextRank从文本数据中提取关键字。

딥러닝

딥러닝을사용하여텍스트데이터분류하기

이예제에서는딥러닝장단기기억(LSTM)신경망을사용하여텍스트데이터를분류하는방법을보여줍니다。

基于卷积神经网络的文本数据分类

这个例子展示了如何使用卷积神经网络对文本数据进行分类。

使用深度学习对内存不足的文本数据进行分类

这个例子展示了如何用深度学习网络使用转换后的数据存储对内存不足的文本数据进行分类。

使用注意的顺序翻译

这个示例演示了如何使用循环序列到序列编码器-解码器模型将十进制字符串转换为罗马数字。

딥러닝을사용하여텍스트생성하기(深度学习工具箱)

이예제에서는텍스트를생성하도록딥러닝장단기기억(LSTM)신경망을훈련시키는방법을보여줍니다。

오만과편견그리고MATLAB

이예제에서는문자임베딩을사용하여텍스트를생성하도록딥러닝LSTM신경망을훈련시키는방법을보여줍니다。

使用深度学习逐字生成文本

这个例子展示了如何训练一个深度学习LSTM网络来逐字生成文本。

使用自定义训练循环对文本数据进行分类

这个例子展示了如何使用带有自定义训练循环的深度学习双向长短期记忆(BiLSTM)网络对文本数据进行分类。

使用自动编码器生成文本

这个例子展示了如何使用自动编码器生成文本数据。

定义文本编码器模型函数

这个例子展示了如何定义一个文本编码器模型函数。

텍스트디코더모델함수정의하기

이예제에서는텍스트디코더모델함수를정의하는방법을보여줍니다。

언어지원

언어고려사항

다른언어에서文本分析工具箱기능을사용하는방법에대한정보。

日本语言支持金宝app

关于文本分析工具箱中的日语支持的信息。金宝app

分析日语文本数据

这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。

德国语言支持金宝app

关于文本分析工具箱中的德语支持的信息。金宝app

分析德语文本数据

这个示例展示了如何使用主题模型导入、准备和分析德语文本数据。

추천예제

딥러닝을사용하여텍스트데이터분류하기

딥러닝을사용하여텍스트데이터분류하기

이예제에서는딥러닝장단기기억(LSTM)신경망을사용하여텍스트데이터를분류하는방법을보여줍니다。

라이브스크립트열기

다단어구문을사용하여텍스트데이터분석하기

다단어구문을사용하여텍스트데이터분석하기

이예제에서는语法빈도수를사용하여텍스트를분석하는방법을보여줍니다。

라이브스크립트열기

토픽모델을사용하여텍스트데이터분석하기

토픽모델을사용하여텍스트데이터분석하기

이예제에서는LDA(잠재디리클레할당)토픽모델을사용하여텍스트데이터를분석하는방법을보여줍니다。

라이브스크립트열기

文本分析工具箱문서

지원

入门文本分析在MATLAB

立即下载