主要内容

字符和字符串

字符数组和字符串数组中的文本

字符数组和字符串数组在MATLAB中为文本数据提供存储®

  • 字符数组是字符序列,就像数字数组是数字序列一样。一个典型的用途是将短文本存储为特征向量,如c = 'Hello World'

  • 字符串数组是文本片段的容器。字符串数组提供了一组将文本作为数据处理的函数。从R2017a开始,您可以使用双引号创建字符串,例如str = "你好,朋友".要将数据转换为字符串数组,请使用字符串函数。

有关更多信息,请参见字符串和字符数组中的文本或者看对文本数据使用字符串数组

功能

全部展开

字符串数组

字符串 字符串数组
字符串 创建没有字符的字符串数组
加入 把字符串
+ 添加数字,添加字符串

字符数组

字符 字符数组
cellstr 转换为字符向量的单元格数组
空白 创建空格字符数组
换行符 创建换行符

字符或字符串数组

组成 将数据格式化为多个字符串
sprintf 将数据格式化为字符串或字符向量
strcat 横向连接字符串
附加 把字符串

将输入参数

convertCharsToStrings 将字符数组转换为字符串数组,保持其他数组不变
convertStringsToChars 将字符串数组转换为字符数组,保持其他数组不变
convertContainedStringsToChars 在单元格数组或结构的任何级别转换字符串数组

数字和字符串之间的转换

双精度数组
字符串 字符串数组
str2double 将字符串转换为双精度值
num2str 转换数字到字符数组

数据类型

ischar 确定输入是否为字符数组
iscellstr 确定输入是否为字符向量的单元格数组
isstring 确定输入是否为字符串数组
isStringScalar 确定输入是否是带有一个元素的字符串数组

文本属性

strlength 字符串的长度
isstrprop 确定输入字符串中哪些字符属于指定类别
胰岛 确定哪些字符是字母
isspace 确定哪些字符是空格字符

找到

包含 确定模式是否在字符串中
匹配 确定模式是否匹配字符串
计数模式在字符串中的出现次数
endsWith 确定字符串是否以pattern结尾
startsWith 确定字符串是否以pattern开头
strfind 在其他字符串中查找字符串
sscanf 从字符串读取格式化的数据

取代

取代 查找并替换一个或多个子字符串
replaceBetween 替换起始点和结束点之间的子字符串
strrep 查找和替换子字符串

建筑模式

模式 搜索和匹配文本的模式

匹配字符模式

alphanumericsPattern 匹配字母和数字字符
characterListPattern 匹配列表中的字符
digitsPattern 匹配数字字符
lettersPattern 匹配字母字符
whitespacePattern 匹配空格字符
wildcardPattern 匹配任何类型的少量字符

模式搜索规则

optionalPattern 使模式可选以匹配
possessivePattern 匹配模式没有回溯
caseSensitivePattern 匹配模式与大小写敏感
caseInsensitivePattern 匹配模式,不管大小写
asFewOfPattern 匹配模式的次数尽可能少
asManyOfPattern 尽可能多地匹配模式

边界模式

alphanumericBoundary 匹配字母数字字符和非字母数字字符之间的边界
digitBoundary 匹配数字字符和非数字字符的边界
letterBoundary 匹配字母字符和非字母字符之间的边界
whitespaceBoundary 匹配空白字符和非空白字符的边界
lineBoundary 匹配行开始或结束
textBoundary 匹配文本的开始或结束
lookAheadBoundary 在指定模式之前匹配边界
lookBehindBoundary 按照指定的模式匹配边界

定制模式显示

maskedPattern 指定显示名称的模式
namedPattern 指定命名模式

正则表达式

正则表达式 匹配正则表达式(区分大小写)
regexpi 匹配正则表达式(不区分大小写)
regexprep 使用正则表达式替换文本
regexptranslate 将文本转换为正则表达式
regexpPattern 匹配指定正则表达式的模式
加入 把字符串
+ 添加数字,添加字符串
分裂 在分隔符处分割字符串
splitlines 在换行符处分割字符串
strjoin 数组中的连接字符串
strsplit 在指定分隔符处分割字符串或字符向量
strtok 弦的选定部分
提取 从字符串中提取子字符串
extractAfter 在指定位置后提取子字符串
extractBefore 在指定位置之前提取子字符串
extractBetween 提取起始点和结束点之间的子字符串
擦除 删除字符串中的子字符串
eraseBetween 删除起始点和结束点之间的子字符串
提取 从字符串中提取子字符串
extractAfter 在指定位置后提取子字符串
extractBefore 在指定位置之前提取子字符串
extractBetween 提取起始点和结束点之间的子字符串
insertAfter 在指定的子字符串之后插入字符串
方法 在指定的子字符串之前插入字符串
在字符串中添加前导或尾随字符
从字符串中删除前导和尾随字符
较低的 将字符串转换为小写
将字符串转换为大写
反向 字符串中字符的顺序颠倒
deblank 删除字符串末尾的空格
strtrim 从字符串中删除前导和尾随空格
strjust 为字符串
匹配 确定模式是否匹配字符串
比较字符串 比较字符串
strcmpi 比较字符串(不区分大小写)
strncmp 比较第一n字符串字符(区分大小写)
strncmpi 比较第一n字符串的字符(不区分大小写)

主题

字符串和字符数组中的文本

使用字符串数组或字符数组存储和操作文本。

用字符串数组分析文本数据

这个例子展示了如何使用字符串数组分析文本数据。它展示了如何存储、分割和排序文本,以及如何计算和收集字符串数组中的文本的统计信息。

格式化文本

组成字符数组或字符串数组,其中包括按照您的规范格式化的普通文本和数据。

搜索和替换文本

MATLAB提供了几个函数来搜索、替换或提取字符串数组和字符向量中的文本。

Unicode和ASCII值

MATLAB将所有字符存储为Unicode字符。字符串和字符向量使用相同的编码。可以将字符转换为Unicode代码值,将数字转换为字符。

十六进制和二进制值

将十六进制和二进制值指定为文字或文本。十六进制和二进制字面值存储为整数。可以将表示十六进制和二进制值的文本转换为数字,将数字转换为文本表示。