主要内容

字符和字符串

字符数组和字符串数组中的文本

字符数组和字符串数组在MATLAB中为文本数据提供存储®

  • 字符数组是一系列字符,就像数字数组是一系列数字。典型用途是将短篇文本存储为特征向量, 如c = 'Hello World'

  • 字符串数组是文本片段的容器。字符串数组提供了一组将文本作为数据处理的函数。从R2017a开始,您可以使用双引号创建字符串,例如str =“问候朋友”。要将数据转换为字符串数组,请使用字符串功能。

有关更多信息,请参见字符串和字符数组中的文本或者看对文本数据使用字符串数组

职能

全部展开

字符串阵列

字符串 字符串数组
创建带有没有字符的字符串数组
加入 把字符串
添加数字,附加字符串

字符数组

字符 字符阵列
Cellstr. 转换为字符向量的单元格数组
空白 创建字符数组的空白
换行符 创建换行符

字符或字符串数组

撰写 将数据格式化为多个字符串
Sprintf. 将数据格式化为字符串或字符向量
strcat 水平连接串
附加 把字符串

转换输入参数

ConvertCharstostrings. 将字符数组转换为字符串数组,保持其他数组不变
ContromingStringStochars. 将字符串数组转换为字符数组,留下其他阵列未置换
convertContainedStringsToChars 在单元格数组或结构的任何级别转换字符串数组

数字和字符串之间的转换

双精度阵列
字符串 字符串数组
str2double 将字符串转换为双重精度值
num2str. 将数字转换为字符数组

数据类型

ischar 确定输入是否是字符数组
Iscellstr. 确定输入是否是字符向量的单元格数组
Isstring. 确定输入是否为字符串数组
isStringScalar 确定输入是否是带有一个元素的字符串数组

文本属性

斯特莱格 弦长
isstrprop 确定输入字符串中的哪些字符是指定类别的
isletter. 确定哪些字符是字母
isspace 确定哪些字符是空格字符

包含 确定模式是否在字符串中
匹配 确定模式是否匹配字符串
数数 数字符串中的模式计数
以。。结束 确定字符串是否以pattern结尾
startsWith 确定字符串是否以pattern开头
strfind. 在其他字符串中查找字符串
sscanf 从字符串读取格式化的数据

取代

取代 查找并替换一个或多个子串
replaceBetween 在开始和结束点之间替换子串
strrep. 查找并替换子串

建筑模式

模式 模式搜索和匹配文本

字符匹配模式

alphanumericsPattern 匹配字母和数字字符
characterlistpattern. 匹配列表中的字符
digitspattern. 匹配数字字符
letterspattern. 匹配字符
Whitespacepattern. 匹配空格字符
野用电动仪 匹配任何类型的少量字符

模式搜索规则

可选择的花attn. 使模式可选以匹配
possessivePattern 匹配图案而不回溯
CASENSITYPATTERN. 匹配模式与大小写敏感
酪蛋白塞atticn. 无论案例如何,匹配模式
asFewOfPattern 匹配模式尽可能几次
asManyOfPattern 匹配模式尽可能多次

边界模式

alphanumericBoundary 匹配字母数字字符和非字母数字字符之间的边界
DigitBoundary. 匹配数字字符和非数字字符的边界
letterBoundary 匹配字母字符和非lowter字符之间的边界
whitespaceBoundary 匹配空格字符和非空白字符之间的边界
LINEBOUNDARY 匹配行的开始或线
TextBeintary. 匹配文本的开始或结尾
看法 指定模式之前的匹配边界
lookBehindBoundary 按照指定的模式匹配边界

自定义模式显示

maskedpattern. 具有指定显示名称的模式
namedpattern. 指定命名模式

常用表达

regexp. 匹配正则表达式(区分大小写)
regexpi. 匹配正则表达式(不区分大小写)
regexprep. 使用正则表达式替换文本
regexptranslate. 将文本转化为正则表达式
regexppattern. 匹配指定正则表达式的模式
加入 把字符串
添加数字,附加字符串
分裂 分隔符的分割字符串
裂缝 在换行符中拆分字符串
strjoin. 数组中的连接字符串
strsplit. 指定分隔符分割字符串或字符向量
strtok 弦的选定部分
提取 从字符串中提取子字符串
extractAfter 在指定位置后提取子字符串
提取物 在指定位置之前提取子字符串
extractBetween 从开始和结束点之间提取子串
擦除 删除字符串中的子串
腐蚀 删除起始点和结束点之间的子字符串
提取 从字符串中提取子字符串
extractAfter 在指定位置后提取子字符串
提取物 在指定位置之前提取子字符串
extractBetween 从开始和结束点之间提取子串
insertAfter 在指定的子字符串之后插入字符串
internbefore. 在指定的子字符串之前插入字符串
软垫 将前导或尾随字符添加到字符串中
跳闸 从字符串中删除前导和尾随字符
降低 将字符串转换为小写
将字符串转换为大写
反向 字符串中字符的顺序颠倒
deblank 从字符串的末尾删除尾随空格
strtrim. 从字符串中删除前导和尾随空格
str 证明字符串
匹配 确定模式是否匹配字符串
比较字符串 比较字符串
strcmpi 比较字符串(不区分大小写)
strncmp. 比较第一N.字符串字符(区分大小写)
strncmpi 比较第一N.字符串的字符(不区分大小写)

话题

字符串和字符数组中的文本

使用字符串数组或字符数组存储和操作文本。

使用字符串数组分析文本数据

这个例子展示了如何使用字符串数组分析文本数据。它展示了如何存储、分割和排序文本,以及如何计算和收集字符串数组中的文本的统计信息。

格式化文本

组成字符数组或字符串数组,其中包括按照您的规范格式化的普通文本和数据。

搜索和替换文本

MATLAB提供了几个函数来搜索、替换或提取字符串数组和字符向量中的文本。

Unicode和ASCII值

MATLAB将所有字符存储为Unicode字符。字符串和字符向量使用相同的编码。可以将字符转换为Unicode代码值,将数字转换为字符。

十六进制和二进制值

将十六进制和二进制值指定为文字或文本。十六进制和二进制字面值存储为整数。可以将表示十六进制和二进制值的文本转换为数字,将数字转换为文本表示。