我试图读取一个UTF-8编码的。txt文件,"data.txt",包含这样的示例信息。
<标题>
命运/ kaleid班轮Prisma☆Illya (Fate/Kaleid Liner Prisma Illya) - MyAnimeList.net
< /名称>
如果我试着;
数据= fileread (“data.txt”);
示例:读取数据
<标题>
命运/ kaleid班轮Prismaâ ~†Illya (Fate/Kaleid Liner Prisma Illya) - MyAnimeList.net
< /名称>
我丢失了UTF8编码的特殊字符。在这里,‘☆’被误读为‘â ~†’。
如果我试着;
文件= fopen (“data.txt”,“r”,“n”,“utf - 8”);
data = fscanf(文件,' % s ');
文件关闭(文件);
示例:读取数据:
<标题> / kaleidlinerPrisma命运☆Illya(命运/ KaleidLinerPrismaIllya) -MyAnimeList.net < /名称>
我可以保留unicode字符,但失去所有空白字符。
如果我试着;
文件= fopen (“data.txt”,“r”,“n”,“utf - 8”);
data = textscan(文件,' % s ');
文件关闭(文件);
示例:读取数据
11×1细胞数组
{' <标题> '}
{“命运/ kaleid”}
{“衬”}
{“棱镜☆Illya”}
{“(命运/ Kaleid”}
...
它是一个由空格分隔的单元格,尽管它确实正确地读取了所有的unicode。
你能给我一个解决这个问题的方法吗?