문서도움말센터문서
이번역번역이지는최신내용을담고담고않습니다않습니다。최신최신내용을영문영문으로여기를클릭클릭
Mecab토큰화옵션
mechaboptions.객체는한국어텍스트와일본어를토큰화토큰화위한위한가옵션을옵션을합니다。
mechaboptions.
지정된mecab토큰화옵션을사용하여하여화화令人畏缩的鳕文의'tokenizemethod'옵션을사용하십시오。
令人畏缩的鳕文
'tokenizemethod'
选项= mechoptions.
选项= MECABOPTIONS(名称,值)
예제
选项= mechoptions.는는일본어토큰화를위한디폴트값으로으로으로으로토큰화을을을
选项
选项= mechoptions(名称,价值)는하나이상의이름 - 값쌍의인수를사용하여가로속성을을합니다。
选项= mechoptions(名称,价值)
名称,价值
모두확장
模型
훈련된모델(mecab사전)의경로로,string형스칼라또는문자형지정됩니다。
디폴트값은일본어토큰화위한위한사전의경로입니다。
예:“c:\ mydict”
“c:\ mydict”
데이터형:char|细绳
char
细绳
Usermodel.
“
모델확장자가포함포함파일(mecab사용자照片.Dic.파일)로,弦형스칼라또는문자형벡터로지정됩니다됩니다。
.Dic.
예:“c:\ myfile.dic”
“c:\ myfile.dic”
LemmaExtractor.
@ textanalytics.ja.mecabtolemma.
Mecab회신에서표제어를추출함수로,함수핸들로지정됩니다。
이함수함수의형식LEMMATA =有趣(单词,信息)여야합니다。여기서字는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。
LEMMATA =有趣(单词,信息)
字
信息
特征-字와동일한크기의토큰으로구성된字符串형벡터(분할분할토큰없이mecab출력출력라인chasen형식으로포함함)。
特征
partofspeech.- 사전내에서에서사분류분류사용되는되는숫자형。
partofspeech.
출력값lemmata.는字와와동일한크기크기의형형배열,추출된표제어를합니다。
lemmata.
디폴트표제어추출기는textanalytics.ja.mecabtolemma.함수입니다。
textanalytics.ja.mecabtolemma.
데이터형:function_handle.
function_handle.
posextractor.
@ textanalytics.ja.mecabtopos.
mecab회신에서에서사정보정보추출추출하는,함수핸들로지정됩니다。
이함수함수의형식Postags =有趣(单词,信息)여야합니다。여기서字는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。
Postags =有趣(单词,信息)
출력값松药는字와동일한크기의分类형형배열,다음범주에서추출된사태그태그를포함。
松药
形容词
adposition.
副词
助动词
COORD-COMPULE.
确定者
欹
名词
数字
代词
适当的名词
标点
象征
动词
其他
디폴트디폴트사정보정보textanalytics.ja.mecabtopos.함수입니다。
textanalytics.ja.mecabtopos.
身体向量
@ textanalytics.ja.mecabtoner.
Mecab회신회신에서명명된엔터티정보를추출하는,함수핸들로지정지정。
이함수함수의형식实体=有趣(单词,信息)여야합니다。여기서字는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。
实体=有趣(单词,信息)
출력값实体는字와와한크기의分类형형배열,다음범주에서추출된엔터티를합니다합니다。
实体
非实体
人
组织
地点
디폴트디폴트사정보정보textanalytics.ja.mecabtoner.함수입니다。
textanalytics.ja.mecabtoner.
모두축소
일본어일본어토큰화를를위한디폴트포함포함mechaboptions.객체객체만듭니다。
选项=具有属性的MECOPTIONS:“C:\ Program Files \ Matlab \ R2019B \ Sys \ Share \ Dict-iPadic”Usermodel:“”LemmaExtractor:@ TextAnalytics.ja.meCabtolemma Posextractor:@ textanalytics.ja.mecabtopos身体表户:@textanalytics.ja.mecabtoner.
사용자지정mecab옵션을사용하여일본어텍스트를토큰화합니다。
일본어일본어텍스트로구성된된형형배열을
str = [“恋恋に,苦しむ。”“恋の悩みで苦しむ。”“空に星が辉き,瞬いている。”“空の星が辉きを増している。”];
mechaboptions.객체를만들고'usermodel'옵션을사용하여사용자모델모델.Dic.파일로지정합니다。
'usermodel'
选项= meCabOptions('usermodel'那'myfile.dic')
选项=具有属性的MECOPTIONS:型号:“C:\ Program Files \ Matlab \ R2019B \ Sys \ Share \ Dict-iPadic”Usermodel:“myfile.dic”LemmaExtractor:@ textAnalytics.ja.mecabtolemma posextractor:@ textanalytics.ja.mecabtoposNeextractor:@ textanalytics.ja.mecabtoner
'tokenizemethod'옵션옵션함께지정된옵션을사용하여텍스트를토큰화。
文档=令人畏缩的document(str,'tokenizemethod',选项)
文档= 4×1令牌Document:6个代币:恋に悩み,苦しむ。6令牌:恋の悩みで苦しむ。10令牌:空に星が辉き,瞬いて星。10令牌:空の星が辉きをている。
添加性达尔|addlangugseTails.|addlemmadetails.|addpartofspeechdetails.|小毒素语言|正常化字|令敬当|令人畏缩的鳕文
添加性达尔
addlangugseTails.
addlemmadetails.
addpartofspeechdetails.
小毒素语言
正常化字
令敬当
다음matlab명령명령에해당하는링크를클릭클릭링크를클릭클릭
명령을실행하려면matlab명령창에입력。웹브라우저는matlab명령명령지원하지않습니다。
选择一个网站,以便在可用的地方进行翻译的内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。
联系您当地的办公室