このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
使用する製品:统计和机器学习工具箱,数据库工具箱,并行计算工具箱,MATLAB®并行服务器™、MATLAB编译器™
いくつかのツールボックスは,高配列の機能を拡張します。これらの拡張機能には,機械学習アルゴリズムの記述,ビッグデータシステムとの統合,およびスタンドアロンアプリの配布などがあります。
统计和机器学习工具箱によって,高配列に対する高度な統計計算を実行できます。次のような機能があります。
k - meansクラスタリング
線形回帰近似
グループ化された統計
分類
詳細については,高配列によるビッグデータの分析(统计学和机器学习工具箱)を参照してください。
高配列の計算を実行する際,既定の実行環境ではローカルMATLABセッションか,または并行计算工具箱がある場合にはローカル並列プールを使用します。并行计算工具箱,MATLAB并行服务器,またはMATLAB编译器を使用する場合、高配列の実行環境を変更するには,関数mapreduce
を使用します。
并行计算工具箱——ローカルワーカーまたはクラスターワーカーを使用して並列計算を実行し,大規模な高配列の計算を高速化。詳細については,並列プールでの高配列の使用(并行计算工具箱)またはクラウドでのビッグデータの処理(并行计算工具箱)を参照してください。
MATLAB并行服务器——Apache火花™対応Hadoop®クラスターなどのクラスターで高配列の計算を実行。これにより,非常に大きな計算の実行時間を大幅に短縮できます。詳細については,火花対応Hadoopクラスターでの高配列の使用(并行计算工具箱)を参照してください。
MATLAB编译器——高配列を含んだMATLABアプリケーションをApache火花のスタンドアロンアプリとして配布。詳細については,火花アプリケーション(MATLAB编译器)を参照してください。
高配列を使用したアルゴリズム開発の利点の1つは,コードの記述が一度で済むことです。ローカルでコードを開発した後,mapreduce
を使用してスケールアップすることで,アルゴリズムを書き換えることなく并行计算工具箱,MATLAB并行服务器、MATLAB编译器などが提供する機能を活用できます。
メモ
高配列は,高(ds)
を使用して作成された場合,それぞれが1つの実行環境にバインドされます。その実行環境が後から変更または削除された場合,高配列は無効になります。
このため,実行環境を変更するたびに高配列を再構成しなければなりません。
数据库工具箱によって,データベース内のデータでバックアップされたDatabaseDatastore
から高表を作成できます。詳細については,使用高数组分析数据库中的大数据(数据库工具箱)を参照してください。
メモ
DatabaseDatastore
には以下の制限があります。
DatabaseDatastore
は,実行環境としてローカルのMATLABセッションを使用しなければなりません。コマンドmapreduce (0)
を使用して,この環境を設定します。
DatabaseDatastore
を使用する高配列を含んだスタンドアロンアプリケーションは,MATLAB编译器を使用してApache火花に配布することはできません。