本主题总结了支持德语文本的文本Analytics Toolbox™功能。金宝app有关展示如何分析德语文本数据的示例,请参阅分析德国文本数据。
这令人畏缩的鳕文
功能自动检测德语输入。或者,设置'语'
选项令人畏缩的鳕文
至'de'
。此选项指定令牌的语言详细信息。要查看令牌的语言详细信息,请使用令敬当
。这些语言详细信息决定了行为Removestopwords.
那addpartofspeechdetails.
那正常化字
那AddsentEnCentails.
, 和添加性达尔
令牌上的功能。
使用授权德语文本令人畏缩的鳕文
。该功能会自动检测德语文本。
str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。
要检测文档中的句子结构,请使用AddsentEnCentails.
。你可以使用缩写
功能要帮助创建要检测的自定义缩写列表。
使用授权德语文本令人畏缩的鳕文
。
str = [“Guten摩根博士施密特。Geht上课Ihnen WIEDER贝瑟?”“HEUTE wird EIN GUTER标签。”];文档=令授权鳕(str);
使用句子详细信息添加到文件中AddsentEnCentails.
。此功能将句号添加到返回的表中令敬当
。查看最初几个令牌的更新令牌详细信息。
文档= AddsentEnCentails(文件);tdetails = tokenDetails(文件);头(Tdetails,10)
ans =.10×6表令牌DocumentNumber SentenceNumber LineNumber上类型语言_________ ______________ ______________ __________ ___________ ________ “Guten” 111封德 “摩根” 111封德 “” 111个标点德 “博士” 1个1 1个信德 “”1个1 1标点符号德 “施密特” 1个1 1个字母德 “”1个1 1标点符号德 “Geht” 1个2 1信德 “ES” 1个2 1信德 “Ihnen” 1个2 1个字母DE
查看德语缩写表。使用此表来帮助创建在使用时创建自定义缩写表以进行句子检测AddsentEnCentails.
。
tbl =缩写('语'那'de');头(TBL)
ans =.8×2表缩写使用____________ _______“A.T”正规“ABL”正规军“阿贝”正规军“ABDR”正规军“ABF”正规军“Abfl”正规军“ABH”正规军“ABK”定期
要将德国语音详细信息添加到文档,请使用addpartofspeechdetails.
功能。
使用授权德语文本令人畏缩的鳕文
。
str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。
首先使用德语文本的言语细节的一部分addpartofspeechdetails.
。
文档= addpartofspeechdetails(文件);
要查看语音细节的部分,请使用令敬当
功能。
tdetails = tokenDetails(文件);头(Tdetails)
ans =.8×7表令牌DocumentNumber SendenceNumber LineNumber型语言PartofSpeech ______________________________________________________________ ____________________________________ _________________________________________________________________________________________________________1 1 1 1个标点符号标点符号“wie”1 2 1字母de adverb“geht”1 2 1字母de动词“es”1 2 1字母de代词“dir”1 2 1字母de代词“?”1 2 1标点符号标点符号
要将实体标记添加到文档,请使用添加性达尔
功能。
使用授权德语文本令人畏缩的鳕文
。
str = [“Ernst Zog Von Frankfurt Nach Berlin。”“Besuchen SIE大众汽车沃尔夫斯堡。”];文档=令授权鳕(str);
要将实体标记添加到德语文本,请使用添加性达尔
功能。此功能检测人员名称,位置,组织和其他命名实体。
文档= AddEntityDetails(文件);
要查看实体详细信息,请使用令敬当
功能。
tdetails = tokenDetails(文件);头(Tdetails)
ans =.8×8表令牌documentnumber sentencenumber inguage语言类型语言partofspeech实体___________ ___________________________________________________tress de brone-nountity“von”字母de adposition none--entity“法兰克福”1 1 1 1字母De Perfore-Noun位置“Nach”1 1 1 1 1 Litter De Adposition非实体“Berlin”1 1 1 1 Litter De Perfice-Noun位置“。1 1 1个标点符号标点符号非实体“BESUCHEN”2 1 1字母DE动词非实体
查看标记为实体的单词“人”
那“地点”
那“组织”
, 或者“其他”
。这些词是没有标记的单词“非实体”
。
idx = tdetails.entity〜=“非实体”;Tdetails(IDX,:)
ans =.5×8表令牌DocumentNumber SentenceNumber LineNumber上类型语言PartOfSpeech实体____________ ______________ ______________ __________ _______ ________ ____________ ____________ “恩斯特” 1 1 1字母DE专有名词的人 “法兰克福” 1 1 1字母DE专有名词的位置 “柏林” 1 1 1字母DE proper-名词位置“Volkswagen”2 1 1字母De Noun组织“Wolfsburg”2 1 1字母De Perfice-Noun位置
要根据标记语言细节从文档中删除停止的话,使用Removestopwords.
。对于德语停止单词列表设置'语'
选项秒表
至'de'
。
使用授权德语文本令人畏缩的鳕文
。该功能会自动检测德语文本。
str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档= tokenizeddocument(str)
文档= 2x1令牌地区:8令牌:Guten Morgen。魏某geht ES目录 ?6个令牌:Heute Wird Ein Guter标签。
使用删除停止单词Removestopwords.
功能。该函数使用文档中的语言详细信息来确定要删除的语言可停止单词。
文档= removestopwords(文件)
文档= 2×1 tokenizedDocument:5个令牌:Guten摩根。geht?5个令牌:HEUTE wird GUTER标签。
要根据令牌语言细节,使用干令牌正常化字
。
使用授权德国文本令人畏缩的鳕文
功能。该功能会自动检测德语文本。
str = [“Guten摩根。魏某geht ES目录?”“HEUTE wird EIN GUTER标签。”];文档=令授权鳕(str);
用来茎干正常化字
。
文档= rangerizewords(文档)
文档= 2x1令牌Document:8令牌:肠摩尔。魏某geht ES目录 ?6令牌:Heut Wird Ein Gut标签。
这Bagofwords.
和bagofngrams.
功能支持金宝app令人畏缩的鳕文
输入无论语言如何。如果你有一个令人畏缩的鳕文
包含数据的数组,然后您可以使用这些功能。
这菲达
和Fitlsa.
功能支持金宝appBagofwords.
和bagofngrams.
输入无论语言如何。如果你有一个Bagofwords.
或者bagofngrams.
包含数据的对象,然后可以使用这些函数。
这训练喜勒姆贝斯丁
功能支持金宝app令人畏缩的鳕文
或文件输入无论语言如何。如果你有一个令人畏缩的鳕文
数组或包含数据格式的数据的文件,然后可以使用此功能。
addlangugseTails.
|addpartofspeechdetails.
|正常化字
|Removestopwords.
|秒表
|令敬当
|令人畏缩的鳕文