帮助中心帮助中心
Unicode utf - 32字符串表示
32位Unicode转换格式(utf - 32)是一个固定长度的Unicode代码点编码,使用32位/代码点。
str32 = textanalytics.unicode.UTF32 (str)
例子
str32= textanalytics.unicode.UTF32 (str)返回的Unicode utf - 32表示str。如果str是一个数组,然后呢str32(我)字符串的Unicode utf - 32表示吗str(我)。
str32= textanalytics.unicode.UTF32 (str)
str32
str
str32(我)
str(我)
全部展开
输入文本,指定为字符串数组,特征向量,或单元阵列特征向量。
例子:["的一个例子短句。”;“第二个短句。”)
["的一个例子短句。”;“第二个短句。”)
数据类型:字符串|字符|细胞
字符串
字符
细胞
数据
uint32
utf - 32代码点,指定为一个向量的整数类型uint32。
如果输入字符串包含代理对,那么相应的代码点有不同长度的列表。
数据类型:uint32
characterCategories
十六进制
全部折叠
将字符串“你好!”使用Unicode utf - 32的字符串表示textanalytics.unicode.UTF32函数。
“你好!”
textanalytics.unicode.UTF32
str =“你好!”;str32 = textanalytics.unicode.UTF32 (str)
str32 = UTF32属性:数据:(128512 72 101 108 108 111 33 32)
Unicode字符类str32使用characterCategories函数。
ucats = characterCategories (str32)
ucats =1 x1单元阵列{[L L L L L P Z S]}
Unicode字符类别“L”、“P”,“Z”,和“S”对应于“信”,“标点符号”、“分离器”,和“象征”。
Unicode字符类str32使用characterCategories函数。设置返回详细Unicode字符类“粒度”选项“详细”。
“粒度”
“详细”
ucats = characterCategories (str32,“粒度”,“详细”)
ucats =1 x1单元阵列{[卢会将会将阿宝z]}
Unicode字符类别“陆”,“会”,“阿宝”,“z”和“所以”对应于“大写字母”,“小写字母”,“其他标点符号”、“空间分隔符”,和“其他符号”。
转换str32使用十六进制值十六进制函数。
hexStr =十六进制(str32)
hexStr = " 0048 0065 006 c 006 c 006 f 0021 0020 1 f600”
转换str32字符串使用字符串函数。
str =字符串(str32)
str = "你好!”
[1]Unicode标准附件# 19 utf - 32https://www.unicode.org/reports/tr19/tr19 - 9. - html
tokenizedDocument|textanalytics.unicode.nfd|characterCategories|十六进制|字符串
tokenizedDocument
textanalytics.unicode.nfd
你有一个修改版的这个例子。你想打开这个例子与编辑?
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
选择一个网站翻译内容,看到当地事件和提供。根据你的位置,我们建议您选择:。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。
联系你当地的办公室