主要内容

La traducción de esta página está obsoleta。Haga clic aquí para ver la última versión en inglés。

Introducción a los almacenes de datos

¿Qué es un almacén de datos?

Un almacén de datos is Un objection para la lecturo único archivoo o recopilación de archivos o datos。El almacén de datos actúa como repositorio para los datos que tienen a misma estructura and El mismo formato。请原谅我,我可以在我们的档案中找到almacén的资料,我们可以在文件中找到我们的资料(como numéricos o texto),我们可以在文件中找到我们的资料,我们可以在文件中找到我们的资料。

Un almacén de datos es útil cuando:

  • 在我们的档案里可以找到recopilación,可以让我们在回忆中有更多的回忆。Un almacén de datos le permite and analizar datos de archiivo en porciones más pequeñas que sí caben en memoria。

  • Los archivos de la recopilación tienen nombres arbitrary(任意的)。Un almacén de datos actúa como Un repositorio de archivos en una o más carpeas。不需要我们的档案记录。

把你的名字写在almacén的资料里,然后把你的资料写在aplicación。我们可以把它看作是我们所承认的。如果你有问题,请参考MATLAB的数据表®.关于datos的almacene的完整列表,请参考“文件格式”或“应用程序”选择“数据存储”

这是datos的档案 Tipo de almacén de datos
Archivos de texto que continenen datos orientados a columns,包括los Archivos CSV。 TabularTextDatastore
形象档案,包括文件格式imreadcomo JPEG y PNG。 ImageDatastore
Archivos de hoja cálculo con format de Excel®admitidos科莫.xlsx SpreadsheetDatastore
他的灵魂是神圣的,他的灵魂是神圣的mapreduce KeyValueDatastore
Archivos Parquet que continenen datos orientados a columns。 ParquetDatastore
档案格式个性化。我们需要你给我们讲一讲。 FileDatastore
Almacén de datos para crear puntos de control en arereglos TallDatastore

我们要从almacén de datos的那一部分看

Utilice脂肪酸的tabularTextDatastore你可以在联合国almacén上找到一份文件airlinesmall.csv在información de llegada y salida de vuelos aerolíneas个别人。这个结果我们不反对TabularTextDatastore

ds = tabularTextDatastore (“airlinesmall.csv”
ds = TabularTextDatastore with properties: Files:{'…\matlab\工具箱\matlab\demo \ airlinessmall .csv'} folder:{'…\matlab\工具箱\matlab\demos'} FileEncoding: 'UTF-8' AlternateFileSystemRoots: {} PreserveVariableNames: false ReadVariableNames: true VariableNames:{'年','月','DayofMonth'…DatetimeLocale: en_US Text Format Properties: NumHeaderLines: 0 Delimiter: ',' RowDelimiter: '\r\n' TreatAsMissing: " MissingValue: NaN Advanced Text Format Properties: TextscanFormats: {'%f', '%f', '%f'…和26 more} TextType: 'char' ExponentCharacters: 'eEdD' CommentStyle: " Whitespace: ' \b\t' MultipleDelimitersAsOne: false属性,控制由preview, read, readall返回的表:{'Year', 'Month', 'DayofMonth'…和26}SelectedFormats: {% f ', ' % f ', ' % f '……and 26 more} ReadSize: 20000 rows OutputType: 'table' RowTimes: [] Write-specific Properties: 金宝appSupportedOutputFormats: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "txt"

Después de crear el almacén de datos,请先想象一下datos在记忆中是什么样子的。把特定的变量(列)放在interés的中间SelectedVariableNames对变量进行预览。

ds。SelectedVariableNames = {“DepTime”“DepDelay”};预览(ds)
ans = 8×2 table DepTime DepDelay _______ ________ 642 12 1021 1 2055 20 1332 12 629 -1 1446 63 928 -2 859 -1

具体来说,他的价值代表了他的价值。在airlinesmall.csv,洛斯瓦洛雷斯是我的代表NA

ds。TreatAsMissing =“NA”

如果要把数据写在almacén上,把数据写在interés在记忆里的变量上,请把中间数据写在funciónreadall

T = readall (ds);

相反地,我们的下合词是más pequeños,我们的下合词是sí我们的中间记忆是función.形式预先确定,función2万美元是联合国的一部分TabularTextDatastore.罪恶的封印,让我们继续保持勇气,为他争取新的勇气ReadSize

ds。ReadSize = 15000;

我们可以在almacén的数据上看到我们的初始状态,我们可以在función的中间状态重置.Llamando a función在联合国bucle我们应该认识到cálculos中间人是为了完成最后的中间人的次合词。Este código计算值máximo计算变量DepDelay

reset(ds) X = [];hasdata(ds) T = read(ds);X(结束+ 1)= max (T.DepDelay);结束maxDelay = max (X)
maxDelay = 1438

如果你的档案里有个人的记忆,你可以把他的名字写在骆驼的名字里联合国档案完整的网址是número de filas concreto。

重置(ds) ds。ReadSize =“文件”;X = [];hasdata(ds) T = read(ds);X(结束+ 1)= max (T.DepDelay);结束maxDelay = max (X);

Además数据的次合词和almacén数据的次合词,我们可以应用函数映射y减少到almacén数据的中位数mapreduce我的名字是中音.Para obtener más información,咨询开始使用MapReducey我记不太牢了

Consulte也

||||||

特马relacionados