搜索和替换文本
处理文本数据通常包括查找和替换的子字符串。有几个函数,找到文本并返回不同的信息:一些功能确认文本存在,而另一些计数,发现指标开始,或提取子字符串。这些功能特征向量和字符串标量,等“是的”
,以及字符和字符串数组,如(“是的”
,“不”;“abc”
,“xyz”
]。此外,您可以使用模式来定义规则搜索,例如一个或多个字母或数字字符。
搜索文本
来确定文本存在,使用一个函数,它返回逻辑值,包含
,startsWith
,或endsWith
。逻辑值1
对应于真实,0
对应于错误的。
txt =她在海边卖贝壳;TF =包含(txt,“海”)
TF =逻辑1
计算文本发生多少次使用数
函数。
n = count (txt,“海”)
n = 2
定位的文本时,使用strfind
函数,它返回起始索引。
idx = strfind (txt,“海”)
idx =1×211 28
找到并使用提取函数中提取文本,如提取
,extractBetween
,extractBefore
,或extractAfter
。
中期= extractBetween (txt,“海”,“岸上”)
中期= "海边的贝壳"
可选地,包括文本的边界。
中期= extractBetween (txt,“海”,“岸上”,“界限”,“包容”)
中期= "海边的贝壳"
找到文本数组
搜索和替换功能还可以找到文本多元素数组。例如,在几个歌名寻找颜色名称。
歌曲= [“黄色潜水艇”;“便士巷”;“黑鸟”];颜色= [“红色”,“黄色”,“蓝色”,“黑色”,“白色”];TF =包含(歌曲、颜色)
TF =3 x1逻辑阵列1 0 1
包含颜色名称的歌曲列表,使用逻辑特遣部队
数组索引到原始的歌曲
数组中。这种技术被称为逻辑索引。
丰富多彩的=歌曲(TF)
色彩斑斓的=2 x1字符串“黄色潜水艇”“黑鸟”
使用的函数取代
替换文本歌曲
匹配的元素颜色
的字符串“橙色”
。
替换(歌曲、颜色“橙色”)
ans =3 x1字符串“橙色潜艇”“便士巷”“Orangebird”
匹配模式
自从R2020b
除了寻找文字的文本,比如“海”或“黄色”,你可以搜索模式相匹配的文本。有许多预定义的模式,比如digitsPattern
找数字位数。
地址=“123年《芝麻街》,纽约,NY 10128”;num =提取(地址、digitsPattern)
num =2 x1字符串“123”“10128”
对于额外的精确搜索,您可以结合模式。例如,定位与字符“S”开头的单词。使用一个字符串来指定“S”的角色,和lettersPattern
寻找额外的字母字符。
帕特=“S”+ lettersPattern;StartWithS =提取(地址、帕特)
StartWithS =2 x1字符串“芝麻”“街”
有关更多信息,请参见构建模式表达式。