主要内容

搜索和替换文本

处理文本数据通常包括查找和替换的子字符串。有几个函数,找到文本并返回不同的信息:一些功能确认文本存在,而另一些计数,发现指标开始,或提取子字符串。这些功能特征向量和字符串标量,等“是的”,以及字符和字符串数组,如(“是的”,“不”;“abc”,“xyz”]。此外,您可以使用模式来定义规则搜索,例如一个或多个字母或数字字符。

搜索文本

来确定文本存在,使用一个函数,它返回逻辑值,包含,startsWith,或endsWith。逻辑值1对应于真实,0对应于错误的。

txt =她在海边卖贝壳;TF =包含(txt,“海”)
TF =逻辑1

计算文本发生多少次使用函数。

n = count (txt,“海”)
n = 2

定位的文本时,使用strfind函数,它返回起始索引。

idx = strfind (txt,“海”)
idx =1×211 28

找到并使用提取函数中提取文本,如提取,extractBetween,extractBefore,或extractAfter

中期= extractBetween (txt,“海”,“岸上”)
中期= "海边的贝壳"

可选地,包括文本的边界。

中期= extractBetween (txt,“海”,“岸上”,“界限”,“包容”)
中期= "海边的贝壳"

找到文本数组

搜索和替换功能还可以找到文本多元素数组。例如,在几个歌名寻找颜色名称。

歌曲= [“黄色潜水艇”;“便士巷”;“黑鸟”];颜色= [“红色”,“黄色”,“蓝色”,“黑色”,“白色”];TF =包含(歌曲、颜色)
TF =3 x1逻辑阵列1 0 1

包含颜色名称的歌曲列表,使用逻辑特遣部队数组索引到原始的歌曲数组中。这种技术被称为逻辑索引

丰富多彩的=歌曲(TF)
色彩斑斓的=2 x1字符串“黄色潜水艇”“黑鸟”

使用的函数取代替换文本歌曲匹配的元素颜色的字符串“橙色”

替换(歌曲、颜色“橙色”)
ans =3 x1字符串“橙色潜艇”“便士巷”“Orangebird”

匹配模式

自从R2020b

除了寻找文字的文本,比如“海”或“黄色”,你可以搜索模式相匹配的文本。有许多预定义的模式,比如digitsPattern找数字位数。

地址=“123年《芝麻街》,纽约,NY 10128”;num =提取(地址、digitsPattern)
num =2 x1字符串“123”“10128”

对于额外的精确搜索,您可以结合模式。例如,定位与字符“S”开头的单词。使用一个字符串来指定“S”的角色,和lettersPattern寻找额外的字母字符。

帕特=“S”+ lettersPattern;StartWithS =提取(地址、帕特)
StartWithS =2 x1字符串“芝麻”“街”

有关更多信息,请参见构建模式表达式

另请参阅

|||||

相关的话题