主要内容

이번역번역이지는최신내용을담고담고않습니다않습니다。최신최신내용을영문영문으로여기를클릭클릭

mechaboptions.

Mecab토큰화옵션

설명

mechaboptions.객체는한국어텍스트와일본어를토큰화토큰화위한위한가옵션을옵션을합니다。

지정된mecab토큰화옵션을사용하여하여화화令人畏缩的鳕文'tokenizemethod'옵션을사용하십시오。

생성

설명

예제

选项= mechoptions.는는일본어토큰화를위한디폴트값으로으로으로으로토큰화을을을

예제

选项= mechoptions(名称,价值는하나이상의이름 - 값쌍의인수를사용하여가로속성을을합니다。

속성

모두확장

훈련된모델(mecab사전)의경로로,string형스칼라또는문자형지정됩니다。

디폴트값은일본어토큰화위한위한사전의경로입니다。

예:“c:\ mydict”

데이터형:char|细绳

모델확장자가포함포함파일(mecab사용자照片.Dic.파일)로,弦형스칼라또는문자형벡터로지정됩니다됩니다。

예:“c:\ myfile.dic”

데이터형:char|细绳

Mecab회신에서표제어를추출함수로,함수핸들로지정됩니다。

이함수함수의형식LEMMATA =有趣(单词,信息)여야합니다。여기서는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。

  • 特征-와동일한크기의토큰으로구성된字符串형벡터(분할분할토큰없이mecab출력출력라인chasen형식으로포함함)。

  • partofspeech.- 사전내에서에서사분류분류사용되는되는숫자형。

출력값lemmata.와와동일한크기크기의형형배열,추출된표제어를합니다。

디폴트표제어추출기는textanalytics.ja.mecabtolemma.함수입니다。

데이터형:function_handle.

mecab회신에서에서사정보정보추출추출하는,함수핸들로지정됩니다。

이함수함수의형식Postags =有趣(单词,信息)여야합니다。여기서는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。

  • 特征-와동일한크기의토큰으로구성된字符串형벡터(분할분할토큰없이mecab출력출력라인chasen형식으로포함함)。

  • partofspeech.- 사전내에서에서사분류분류사용되는되는숫자형。

출력값松药와동일한크기의分类형형배열,다음범주에서추출된사태그태그를포함。

  • 形容词

  • adposition.

  • 副词

  • 助动词

  • COORD-COMPULE.

  • 确定者

  • 名词

  • 数字

  • 代词

  • 适当的名词

  • 标点

  • 象征

  • 动词

  • 其他

디폴트디폴트사정보정보textanalytics.ja.mecabtopos.함수입니다。

데이터형:function_handle.

Mecab회신회신에서명명된엔터티정보를추출하는,함수핸들로지정지정。

이함수함수의형식实体=有趣(单词,信息)여야합니다。여기서는토큰으로구성된字符串형벡터이고,信息는다음필드를갖는입니다입니다。

  • 特征-와동일한크기의토큰으로구성된字符串형벡터(분할분할토큰없이mecab출력출력라인chasen형식으로포함함)。

  • partofspeech.- 사전내에서에서사분류분류사용되는되는숫자형。

출력값实体와와한크기의分类형형배열,다음범주에서추출된엔터티를합니다합니다。

  • 非实体

  • 组织

  • 地点

  • 其他

디폴트디폴트사정보정보textanalytics.ja.mecabtoner.함수입니다。

데이터형:function_handle.

예제

모두축소

일본어일본어토큰화를를위한디폴트포함포함mechaboptions.객체객체만듭니다。

选项= mechoptions.
选项=具有属性的MECOPTIONS:“C:\ Program Files \ Matlab \ R2019B \ Sys \ Share \ Dict-iPadic”Usermodel:“”LemmaExtractor:@ TextAnalytics.ja.meCabtolemma Posextractor:@ textanalytics.ja.mecabtopos身体表户:@textanalytics.ja.mecabtoner.

사용자지정mecab옵션을사용하여일본어텍스트를토큰화합니다。

일본어일본어텍스트로구성된된형형배열을

str = [“恋恋に,苦しむ。”“恋の悩みで苦しむ。”“空に星が辉き,瞬いている。”“空の星が辉きを増している。”];

mechaboptions.객체를만들고'usermodel'옵션을사용하여사용자모델모델.Dic.파일로지정합니다。

选项= meCabOptions('usermodel''myfile.dic'
选项=具有属性的MECOPTIONS:型号:“C:\ Program Files \ Matlab \ R2019B \ Sys \ Share \ Dict-iPadic”Usermodel:“myfile.dic”LemmaExtractor:@ textAnalytics.ja.mecabtolemma posextractor:@ textanalytics.ja.mecabtoposNeextractor:@ textanalytics.ja.mecabtoner

'tokenizemethod'옵션옵션함께지정된옵션을사용하여텍스트를토큰화。

文档=令人畏缩的document(str,'tokenizemethod',选项)
文档= 4×1令牌Document:6个代币:恋に悩み,苦しむ。6令牌:恋の悩みで苦しむ。10令牌:空に星が辉き,瞬いて星。10令牌:空の星が辉きをている。
R2019B에개발됨