主要内容

德语支持金宝app

本主题总结了支持德语文本的文本Analytics Toolbox™功能。金宝app有关展示如何分析德语文本数据的示例,请参阅分析德国文本数据

象征化

令人畏缩的鳕文功能自动检测德语输入。或者,设置'语'选项令人畏缩的鳕文'de'。此选项指定令牌的语言详细信息。要查看令牌的语言详细信息,请使用令敬当这些语言详细信息决定了行为Removestopwords.addpartofspeechdetails.正常化字AddsentEnCentails., 和添加性达尔令牌上的功能。

授权德语文本

使用授权德语文本令人畏缩的鳕文。该功能会自动检测德语文本。

str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。

句子检测

要检测文档中的句子结构,请使用AddsentEnCentails.。你可以使用缩写功能要帮助创建要检测的自定义缩写列表。

将句子详细信息添加到德语文件

使用授权德语文本令人畏缩的鳕文

str = [“Guten摩根博士施密特。Geht上课Ihnen WIEDER贝瑟?”“HEUTE wird EIN GUTER标签。”];文档=令授权鳕(str);

使用句子详细信息添加到文件中AddsentEnCentails.。此功能将句号添加到返回的表中令敬当。查看最初几个令牌的更新令牌详细信息。

文档= AddsentEnCentails(文件);tdetails = tokenDetails(文件);头(Tdetails,10)
ans =.10×6表令牌DocumentNumber SentenceNumber LineNumber上类型语言_________ ______________ ______________ __________ ___________ ________ “Guten” 111封德 “摩根” 111封德 “” 111个标点德 “博士” 1个1 1个信德 “”1个1 1标点符号德 “施密特” 1个1 1个字母德 “”1个1 1标点符号德 “Geht” 1个2 1信德 “ES” 1个2 1信德 “Ihnen” 1个2 1个字母DE

德国缩写表

查看德语缩写表。使用此表来帮助创建在使用时创建自定义缩写表以进行句子检测AddsentEnCentails.

tbl =缩写('语''de');头(TBL)
ans =.8×2表缩写使用____________ _______“A.T”正规“ABL”正规军“阿贝”正规军“ABDR”正规军“ABF”正规军“Abfl”正规军“ABH”正规军“ABK”定期

讲话细节的一部分

要将德国语音详细信息添加到文档,请使用addpartofspeechdetails.功能。

获得德语文本的讲话细节的一部分

使用授权德语文本令人畏缩的鳕文

str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。

首先使用德语文本的言语细节的一部分addpartofspeechdetails.

文档= addpartofspeechdetails(文件);

要查看语音细节的部分,请使用令敬当功能。

tdetails = tokenDetails(文件);头(Tdetails)
ans =.8×7表令牌DocumentNumber SendenceNumber LineNumber型语言PartofSpeech ______________________________________________________________ ____________________________________ _________________________________________________________________________________________________________1 1 1 1个标点符号标点符号“wie”1 2 1字母de adverb“geht”1 2 1字母de动词“es”1 2 1字母de代词“dir”1 2 1字母de代词“?”1 2 1标点符号标点符号

命名实体认可

要将实体标记添加到文档,请使用添加性达尔功能。

将命名实体标记添加到德语文本

使用授权德语文本令人畏缩的鳕文

str = [“Ernst Zog Von Frankfurt Nach Berlin。”“Besuchen SIE大众汽车沃尔夫斯堡。”];文档=令授权鳕(str);

要将实体标记添加到德语文本,请使用添加性达尔功能。此功能检测人员名称,位置,组织和其他命名实体。

文档= AddEntityDetails(文件);

要查看实体详细信息,请使用令敬当功能。

tdetails = tokenDetails(文件);头(Tdetails)
ans =.8×8表令牌documentnumber sentencenumber inguage语言类型语言partofspeech实体___________ ___________________________________________________tress de brone-nountity“von”字母de adposition none--entity“法兰克福”1 1 1 1字母De Perfore-Noun位置“Nach”1 1 1 1 1 Litter De Adposition非实体“Berlin”1 1 1 1 Litter De Perfice-Noun位置“。1 1 1个标点符号标点符号非实体“BESUCHEN”2 1 1字母DE动词非实体

查看标记为实体的单词“人”“地点”“组织”, 或者“其他”。这些词是没有标记的单词“非实体”

idx = tdetails.entity〜=“非实体”;Tdetails(IDX,:)
ans =.5×8表令牌DocumentNumber SentenceNumber LineNumber上类型语言PartOfSpeech实体____________ ______________ ______________ __________ _______ ________ ____________ ____________ “恩斯特” 1 1 1字母DE专有名词的人 “法兰克福” 1 1 1字母DE专有名词的位置 “柏林” 1 1 1字母DE proper-名词位置“Volkswagen”2 1 1字母De Noun组织“Wolfsburg”2 1 1字母De Perfice-Noun位置

停止单词

要根据标记语言细节从文档中删除停止的话,使用Removestopwords.。对于德语停止单词列表设置'语'选项秒表'de'

从文件中删除德国停止单词

使用授权德语文本令人畏缩的鳕文。该功能会自动检测德语文本。

str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。

使用删除停止单词Removestopwords.功能。该函数使用文档中的语言详细信息来确定要删除的语言可停止单词。

文档= removestopwords(文件)
文档= 2×1 tokenizedDocument:5个令牌:Guten摩根。geht?5个令牌:HEUTE wird GUTER标签。

要根据令牌语言细节,使用干令牌正常化字

干德文文本

使用授权德国文本令人畏缩的鳕文功能。该功能会自动检测德语文本。

str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档=令授权鳕(str);

用来茎干正常化字

文档= rangerizewords(文档)
文档= 2x1令牌Document:8令牌:肠摩尔。魏某geht ES目录 ?6令牌:Heut Wird Ein Gut标签。

语言无关功能

单词和n-gram计数

Bagofwords.bagofngrams.功能支持金宝app令人畏缩的鳕文输入无论语言如何。如果你有一个令人畏缩的鳕文包含数据的数组,然后您可以使用这些功能。

建模与预测

菲达Fitlsa.功能支持金宝appBagofwords.bagofngrams.输入无论语言如何。如果你有一个Bagofwords.或者bagofngrams.包含数据的对象,然后可以使用这些函数。

训练喜勒姆贝斯丁功能支持金宝app令人畏缩的鳕文或文件输入无论语言如何。如果你有一个令人畏缩的鳕文数组或包含数据格式的数据的文件,然后可以使用此功能。

也可以看看

||||||

相关话题