主要内容

语境

在上下文中搜索单词或n-gram出现的文档

描述

例子

T.=上下文(文件单词搜索一个单词的出现文件并返回表格显示单词在上下文及其地点。默认情况下,该函数区分大小写。

例子

T.=上下文(文件n搜索n-gram的出现文件。默认情况下,该函数区分大小写。

例子

T.=上下文(___contextLength.指定使用以前的任何语法返回的上下文的长度。

例子

T.=上下文(___名称,价值使用任何先前语法使用一个或多个名称 - 值对参数指定其他选项。

例子

全部收缩

加载示例数据。文件sonnetspreprocessed.txt.txt.包含Precrocessed版本的莎士比亚的十四行诗。该文件每行包含一个十四行诗,单词由空格分隔。从中提取文本sonnetspreprocessed.txt.txt.,将文本拆分为换行符的文档,然后授权文档。

filename =.“sonnetspreprocessed.txt”;str = inthelfiletext(filename);textdata = split(str,newline);文档= tokenizeddocument(textdata);

搜索“生活”这个词。

tbl =上下文(文档,“生活”);头(TBL)
ans =.8×3表上下文文件词________________________________________________ ____ _____________你是自我单身人生啊,你发行的伪造线生命修复时间铅笔“16 35”铅笔蛹“16 36”天堂知道坟墓显示半部件写B“17 17”他的眼睛长寿赋予生命,给人“18 69”招标大使馆爱你的生命让生活四人两个单独沉没“45 23”虽然情侣生活美容应该是黑色线条“63 50”秃头Live Edifient Editys Emeyys“68 27

查看字符串数组中的出现。

tbl.context.
ans =.23x1字符串“消费主义者自己的单身人生啊,你是没有伪造的线条生命修复时间铅笔”“D假冒线条生活维修时间铅笔蛹”“”天堂知道坟墓隐藏生活显示半部分写作“”他的眼睛长期以来一直留下眼睛留意生活你“招标大使馆爱你的生活造成了四个独自沉沦”“虽然情侣生活美女应该是黑色线条”“哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇“ST Bail将携带寿命偏爱救生员”“艺术你失去了渣滓猎物猎物猎物身体死牛”“思想食物生活Sweetseasond Showers Gro”“TTIN名称因此不朽的生活虽然曾经已经消失了给生命带来坟墓生命生命生命“”生活带来坟墓生命生活公平的眼睛诗人赞美D“”“偷走自己的学期生活你好艺术放心我的Li”“Fe thou art保证矿山生活越来越多的爱情留下的人”最少生活最终更好的状态是“”一个st vex不动情的思维生活你的反叛Doth谎言啊“”更快的时间浪费生活你可以防止镰刀“”有害行为更美好的生活提供公众意味着酒吧“”吃了仇恨扔掉了救球人士“”“很多若虫誓言生活保留来绊倒了Maide“

加载示例数据。文件sonnetspreprocessed.txt.txt.包含Precrocessed版本的莎士比亚的十四行诗。该文件每行包含一个十四行诗,单词由空格分隔。从中提取文本sonnetspreprocessed.txt.txt.,将文本拆分为换行符的文档,然后授权文档。

filename =.“sonnetspreprocessed.txt”;str = inthelfiletext(filename);textdata = split(str,newline);文档= tokenizeddocument(textdata);

搜索BIGRAM“DOST你”。

ngram = [“dost”“你”];tbl =上下文(文件,ngram);头(TBL)
ans =.8×3表上下文文档字____________________________________________________________________________________________________ _________________________ uthou ut thy thy thy thy thy thy thy thy thy thy thy thy'4 4 5“ee beauteous niggard为什么dost thoubus滥用巨大的船只”4 25 25 26“vere usurer为什么笨重的概念_ 4 3536“Eavy眼皮疲惫的夜间Dost你的愿望拖鞋伤了S”61 10 11“甜蜜可爱的DOST你让耻辱就像Canker F”95 3 4“Hy Budding名称O Sweets Dost Thy Thy Thy Thy Thy Sins附着舌”95 19 20“露丝美女爱依赖Dostub你有尊严的制作“101 16 17”你盲目傻瓜爱情DOTT你的眼睛看到了“137 5 6

查看字符串数组中的出现。

tbl.context.
ans =.10x1字符串“不持续的可爱,为什么要在自己的自我上度过”“ee美丽的黑鬼为什么要滥用冒险的大理”为什么vere profless usurer为什么笨拙的咖啡师“”Eavy眼皮疲惫的夜晚Dost你的愿望拖着的人“甜蜜的可爱的dost你让耻辱像溃疡f“”hy budding name o sweet drost thy thy thy thy thy thy thy thy舌头“”露齿般的美丽爱情取决于你有尊严的让你有尊严的制作“你是我的眼睛,你的眼睛看起来很明显”权力数组为什么Dosu Pine遭受弱点涂料“”Y大的成本短暂租赁DOST你在你的渐渐豪宅“

加载示例数据。文件sonnetspreprocessed.txt.txt.包含Precrocessed版本的莎士比亚的十四行诗。该文件每行包含一个十四行诗,单词由空格分隔。从中提取文本sonnetspreprocessed.txt.txt.,将文本拆分为换行符的文档,然后授权文档。

filename =.“sonnetspreprocessed.txt”;str = inthelfiletext(filename);textdata = split(str,newline);文档= tokenizeddocument(textdata);

搜索“Life”这个词,并在之前和之后使用15个字符的上下文返回每次发生。

tbl =上下文(文档,“生活”15);头(TBL)
ans =.8×3表上下文文件文字________________________________ ____________ ____ ____ ____ _________伊斯赛“9 10”先装线路生活寿命修复TI“16 35”EIT线生活生活修复时间P“16 36”俄罗斯覆盖生活显示半决面“17 17”ng生命为生命喵喵叫“18 69”的爱情爱你的生命派了四个两个“45 23”虽然情侣生活美容应该是b“63 50”苍蝇的第二次头呃“68 27

查看字符串数组中的出现。

tbl.context.
ans =.23x1字符串“我是自我单身人生啊,你是伊斯特”“先装线生活生活修复TI”“EIT线生活生活修复时间P”“oWS坟墓隐藏生活显示半比例”“”ng生活给生活你“”“ASSY爱你的生活犯了四个“虽然恋人生活美女应该是b”艾刚的第二次生命第二次头呃“”让爱情甚至生命衰变以免威斯“”“所有带走生活猎物猎物猎物猎物蠕虫虫”“思想食物生活SweetsondS“”“不朽的生命虽然o”“te offorte offer带来坟墓liv”“陵墓生命的生活公平的眼睛诗人”“自走的学期生活,你是艺术家”的“我的生活更长的是你的生活更长”生命HATH结束贝蒂“”不稳定的思维生活你的反射点“”呃时间浪费生活你可以防止“”我的行为更好的生活提供了公众“的”扔救球人士“”“HS誓言贞洁的生活保持旅行”

指定要显示上下文的源文本。

加载sonnets.txt.数据并将其分成单独的文档。

txt = extractfiletext(“sonnets.txt”);段落= split(txt,[newline newline]);

从中提取十四行诗。第一个十四行诗是段落的第五个元素,其余的十四圈以后出现在每个第二个元素中。

Sonnets =段落(5:2:结束);文档=令叫象征(Sonnets);

正常化文本,然后搜索“Life”这个词。

documentnorormalized = normalizewords(文档);t =上下文(DocumentNnormalized,“生活”
t =23×3表上下文文档字_________________________________________________________“SINGL生活中的SUCSST THY SECRES?啊!如果你是不是”9 18“:那么生命的生活线路应该修复,哪个”16 73“LD生活修复的生活线路,which thi , tim" 16 75 "s a tomb which hide your life , and show not half your" 17 34 " live thi , and thi give life to thee . " 18 128 "ssi of love to thee , my life , be made of four , with" 45 53 "eauti , though my lover' life : hi beauti shall in the" 63 100 " awai , to live a second life on second head ; er beau" 68 59 "t your love even with my life decai ; lest the wise wo" 71 118 "shall carri me awai , my life hath in thi line some in" 74 18 "ast but lost the dreg of life , the prei of worm , my " 74 83 "to my thought as food to life , or as sweet-season'd s" 75 10 "ur name from henc immort life shall have , though i , " 81 42 " , when other would give life , and bring a tomb . the" 83 108 "a tomb . there live more life in on of your fair ey th" 83 118 "yself awai , for term of life thou art assur mine ; an" 92 13 ⋮

由于单词归一化,因此上下文可能不容易读取。要使用原始文本数据查看上下文,请使用该上下文使用源文本'来源'选项。

t =上下文(DocumentNnormalized,“生活”'来源',十四行诗)
t =23×3表上下文文件词_________________________________________________________“嗯,在单一的生活中,你是自己的自我?啊!如果你是不是”9 18“:那么生命的生活方式应该修复,哪个”16 73“d的生活修复,这是哪一个,时间“16 75”一个隐藏你的生命的坟墓,并显示你的“17 34”ves的一半,这为你带来了生命。“18 128”18 128“为你的生活,我的生活,正在制作四个,机智“45 53”理发,虽然我的情人的生命:他的美丽应该在“63 100”,在第二头上过第二次生命; ERE Beau“68 59”你的爱情即使我的生命衰变也是如此;以免聪明“71 118”要带走我,我的生活在这一行里有些我“74 18”st但失去了生活的渣滓,蠕虫的猎物,我的b“74 83”o我的想法是我的思想从生命中,或者作为甜蜜的赛季的SH“75 10”名称从此不朽的生活,虽然我在“8122”上,但其他人会给生活,并带来坟墓。“83 108”一个坟墓。有一个生活中的生活你的公平眼睛“83 118”幸福,对于生活的术语,你是保证矿井;A“92 13⋮

输入参数

全部收缩

输入文档,指定为a令人畏缩的鳕文大批。

在上下文中查找的单词,指定为包含字符向量的字符串标量,字符向量或标量单元数组。

数据类型:char|细绳|细胞

n-gram在上下文中找到,指定为字符串数组或字符向量阵列。

n有规模1-经过-N, 在哪里N是n-gram中的单词数。的价值ngram(j)是个jn-gram的单词。

该函数忽略尾随空字符串n

数据类型:细绳|细胞

上下文长度,指定为正整数。

名称值对参数

指定可选的逗号分离对名称,价值论点。名称是参数名称和价值是相应的价值。名称必须出现在引号内。您可以以任何顺序指定多个名称和值对参数name1,value1,...,namen,valuen

例子:'求解','avb'指定使用近似变分贝内斯作为求解器。

源文本,指定为逗号分隔的配对'来源'和字符串数组或字符向量的单元数组。如果输入文档是预处理的,并且您拥有源文本,那么您可以使用此选项使输出更可读。

源文本必须与尺寸相同文件

忽略案例的选项,指定为逗号分隔的配对'Ignorecase'和以下之一:

  • 错误的- 搜索与单词或n-gram匹配的出现。

  • 真的- 搜索符合Word或N-Gram忽略案例的出现。

输出参数

全部收缩

具有这些列的上下文表:

语境 字符串包含上下文中查询的单词或n-gram
文档 包含单词或n-gram的文档的数字索引
单词 文档中单词或n-gram的数字索引

在R2017B中介绍