主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

groupsummary

グループ要約の計算

説明

G= groupsummary (Tgroupvarsは、表または时间表であるTのデータについて,計算されたグループおよび各グループの要素数を含む表を返します。グループは,groupvarsのグループ化変数の一意の組み合わせを含みます。たとえば,G = groupsummary (T '性别')は,変数性别内の男性要素の数と,要素の数を返します。

G= groupsummary (Tgroupvars方法は,方法で指定された計算も返します。たとえば,G = groupsummary (T,“性别”,“中值”)は,各グループの要素数に加えて,両方の性別についてT内のすべての非グループ化変数の中央値を返します。

G= groupsummary (Tgroupvars方法datavarsは,計算を適用する変数を指定します。

G= groupsummary (Tgroupvarsgroupbinsは,groupvars内のデータをビン化する方法を指定します。たとえば,G = groupsummary (T,‘SaleDate’,‘年’)は,グループ化変数SaleDateに従って,各年度内のTのすべての売上げのグループカウントを与えます。

G= groupsummary (Tgroupvarsgroupbins方法は,方法で指定された計算について,groupbinsに従ってデータをビン化します。

G= groupsummary (Tgroupvarsgroupbins方法datavarsは,groupbinsに従ってデータをビン化し,計算を適用する変数を指定します。

G= groupsummary (___名称,值は,前述の任意の構文について名前と値のペアを1つ以上使用して,追加のグループ化プロパティを指定します。たとえば,G = groupsummary (T,‘Category1’,‘IncludeMissingGroups’,假)は,<定义>で指定された欠損分类データから作成されたグループを除外します。

B= groupsummary (一个groupvars方法は,一个がベクトルまたは行列の場合に,groupvarsのグループ化ベクトルの一意の組み合わせに従って計算を返します。groupvarsは列ベクトル行,列,または列ベクトルの细胞配列にすることができます。

B= groupsummary (一个groupvarsgroupbins方法は,groupbinsに従ってデータをビン化します。

B= groupsummary (___名称,值は,前述の配列構文のいずれかについて,名前と値のペアを1つ以上使用して,追加のグループ化プロパティを指定します。

BBG) = groupsummary (一个___は,各グループ化ベクトルのグループも返します。

BBG公元前) = groupsummary (一个___は,各グループのグループカウントも返します。

すべて折りたたむ

表変数の要約統計を計算します。

5人の個人に関する情報を含む表Tを作成します。

性别= [“男性”“女性”“女性”“男性”“男性”];年龄=[38,43岁,38;40;49);身高= [71;69;64;67;64);重量= [176;163;131;133;119);T =表(性别、年龄、身高、体重)
T =5×4表性别年龄身高体重________ ___ ______ ______“男”38 71 176“女”43 69 163“女”38 64 131“男”40 67 133“男”49 64 119

グループ化変数として性别を指定して,男性と女性の人数を計算します。

G = groupsummary (T),“性别”
G =2×2表性别GroupCount  ________ __________ " 女“2”男”3

女性と男性の平均年齢,身長,体重をそれぞれ計算します。

G = groupsummary (T),“性别”“的意思是”
G =2×5表性别GroupCount mean_Age mean_Height mean_Weight  ________ __________ ________ ___________ ___________ " 女性男性“40.5 - 66.5 147 3 42.333 67.333 142.67

性別でグループ化して,平均身長のみを計算します。

G = groupsummary (T),“性别”“中值”“高度”
G =2×3表性别GroupCount median_Height  ________ __________ _____________ " 女“2 66.5”男“3 67

2つのグループ化変数を使用してテーブルデータをグループ化します。

5人の個人に関する情報を含む表Tを作成します。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);T =表(性别、吸烟、体重)
T =5×3表性别吸烟者体重________ ______ ______“男”真176“女”假163“男”真131“女”假133“男”真119

性別および喫煙状態でグループ化した,平均体重を計算します。既定では,性別と喫煙状態の2つの組み合わせは空のグループであるため,出力に表されません。

G = groupsummary (T) {“性别”“抽烟”},“的意思是”“重量”
G =2×4表性别吸烟者GroupCount mean_Weight  ________ ______ __________ ___________ " 女“错误148”男“真正的142

“IncludeEmptyGroups”パラメーター値を真正的に設定して,空の組み合わせを含む,すべてのグループの組み合わせを表示します。

G = groupsummary (T) {“性别”“抽烟”},“的意思是”“重量”“IncludeEmptyGroups”,真正的)
G =4×4表性别吸烟者GroupCount mean_Weight ________ ______ __________ ___________“女”假2 148“女”真0 NaN“男”假0 NaN“男”真3 142

指定されたビンに従ってデータをグループ化します。

1か月以内の日数分の売上情報が含まれる时间表を作成します。

timestamp = datetime([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;...2017年3 14;2017年3 31;2017年3 25;...2017年3 29;2017年3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';TotalItemsSold = [14 13 8 5 10 16 8 6 7 11]';TT =时间表(时间戳,利润,TotalItemsSold)
TT =10×2时间表时间戳利润TotalItemsSold ___________ ______ ______________ 04- march -2017 2032 14 02- march -2017 3071 13 15- march -2017 1185 8 10- march -2017 2587 5 14- march -2017 1998 10 31- march -2017 2899 16 25- march -2017 3112 8 29- march -2017 909 6 21- march -2017 2619 7 18- march -2017 3085 11

品目番号の区間にグループをビン化し,売却済品目合計でグループ化された平均利益を計算します。

格式shorteG = groupsummary (TT,“TotalItemsSold”,[0 4 8 12 16],“的意思是”“利润”
G =3×3表disc_TotalItemsSold GroupCount mean_Profit  ___________________ __________ ___________ [ 4、8)3.0000 2.0383 e + e + 00 03[8、12)4.0000 e + 00 2.3450 e + 03(12、16)3.0000 e + 00 2.6673 e + 03

曜日別にグループ化された平均利益を計算します。

G = groupsummary (TT,“时间戳”“dayname”“的意思是”“利润”
G =5×3表dayname_TimeStamps GroupCount mean_Profit __________________ __________ ___________周二2.0000e+00 2.3085e+03周三2.0000e+00 1.0470e+03周四1.0000e+00 3.0710e+03周五2.0000e+00 2.7430e+03周六3.0000e+00 2.7430e+03

日付のベクトルと,対応する利益額のベクトルを作成します。

timeStamps = datetime([2017 3 4;2017年3 - 2;2017年3 15;2017年3 10;...2017年3 14;2017年3 31;2017年3 25;...2017年3 29;2017年3 21;2017 3 18]);利润= [2032 3071 1185 2587 1998 2899 3112 909 2619 3085]';

曜日別の平均利益を計算します。各グループの平均,グループ名,メンバー数を表示します。

格式shorte[meanDailyProfit, dayOfWeek dailyCounts] = groupsummary(利润,时间戳,“dayname”“的意思是”
meanDailyProfit =5×12.3085e+03 1.0470e+03 3.0710e+03 2.7430e+03 2.7430e+03
dayOfWeek =5 x1分类星期二星期三星期四星期五星期六
dailyCounts =5×12 2 1 2 3

性別と喫煙状況に基づいて,4つのグループの平均体重を計算します。

患者情報を異なるタイプの3つのベクトルとして保存します。

性别= [“男性”“女性”“男性”“女性”“男性”];吸烟者=逻辑([1,0,1,0,1]);重量= [176;163;131;133;119);

性別と喫煙状況でグループ化し,平均体重を計算します。Bには各グループの平均値(空のグループの場合は)が格納されます。BGは,行基準で要素を見た場合のグループを表す2つのベクトルを含む细胞配列です。たとえば,BG {1}の最初の行からは,最初のグループの患者が女性であることがわかり,BG {2}の最初の行からは,これらの患者が非喫煙者であることがわかります。最後に,公元前には,BGの対応する各グループのメンバー数が格納されます。

[B, BG,公元前]= groupsummary(重量,{性别、吸烟},“的意思是”“IncludeEmptyGroups”,真正的);B
B =4×1148南南142
BG {1}
ans =4 x1字符串"female" "female" "male" "male"
BG {2}
ans =4 x1逻辑阵列0 1 0 1
公元前
公元前=4×12 0 0 3

患者情報を含むデータを読み込み,各患者の性別,収縮期および拡張期の血圧、身長,体重を記述する表を作成します。

负载病人T =表(性别、收缩压、舒张压、身高、体重)
T =100×5表性别收缩压舒张压高的重量  __________ ________ _________ ______ ______ {' 男性}124 93 71 176{‘男性’}163{‘女性’}125 109 77 69 83 64 131{‘女性’}133{‘女性’}122 117 75 67 80 64 119{‘女性’}142{‘女性’}130 121 70 68 88 64 142{‘男性’}180{‘男性’}115 115 82 68 78 68 183{‘女性’}118 86 66 132{‘女性’}114 77 68128 {'Female'} 115 68 66 137 {'Male' } 127 74 71 174 {'Male' } 130 95 72 202 {'Female'} 114 79 65 129 {'Male' } 130 92 71 181 ⋮

性別でグループ化し,患者の身長と体重の間の相関と収縮期および拡張期の血圧の間の相関を計算します。相関を計算する方法として関数xcovを使用します。xcovの最初の2つの入力引数は相関するデータを記述し,3番目の引数はラグサイズを記述し,4番目の引数は正規化の種類を記述します。各グループ計算で,xcovに渡される引数xyは2つのセル要素(“高度”、“收缩”)(“重量”、“舒张期”)の変数によってペアで指定されます。

G = groupsummary (T),“性别”@ (x, y) xcov (x, y, 0,多项式系数的), {[“高度”“收缩”]、[“重量”“舒张期”]})
G =2×4表性别GroupCount fun1_Height_Weight fun1_Systolic_Diastolic  __________ __________ __________________ _______________________ {' 女性的53 0.071278 - 0.48731{‘男性’}}47 0.047571 - 0.50254

あるいは,データが表ではなくベクトルまたは行列形式である場合,相関するデータをgroupsummaryの最初の入力引数として提供できます。

(G, GR, GC) = groupsummary({(身高、收缩),(重量、舒张压)},性别,@ (x, y) xcov (x, y, 0,多项式系数的))
G =2×20.0713 0.4873 0.0476 0.5025
GR =2 x1细胞{'女'}{‘男性’}
GC =2×153个47

入力引数

すべて折りたたむ

入力データ。表格または时间表として指定します。

入力配列。ベクトル、行列、ベクトルまたは行列の cell 配列として指定します。

複数の入力引数を受け入れる方法の関数ハンドルを指定する場合,入力データ一个はベクトルまたは行列の细胞配列でなければなりません。グループ単位での関数の各呼び出しでは,入力引数は细胞配列の各要素の対応する列です。以下に例を示します。

  • groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))は各グループのmyFun (x1, y1)を計算します。

  • groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))は最初に各グループのmyFun (x1, y1)を計算し,次に各グループのmyFun (x2, y2)を計算します。

グループ化変数またはベクトル。スカラー、ベクトル、行列、cell 配列、関数ハンドル、または tablevartype添字として指定します。

入力データが表または时间表の場合,groupvarsはグループの計算にどの列を使用するかを表し,次のいずれかにできます。

  • 単一の表変数名を指定する文字ベクトルまたはスカラー字符串

  • 各要素が表変数名である,文字ベクトルの细胞配列または字符串配列

  • 表変数インデックスのベクトル

  • 各要素が表変数に対応する逻辑ベクトル。真正的の場合は対応する変数を含めて,の場合は対応する変数を除外します。

  • 入力として表変数をとり,逻辑スカラーを返す関数ハンドル

  • 表格vartype添字

配列入力の場合,groupvars一个と同じ行数をもつ列ベクトルか,行列内あるいは细胞配列内に配置した列ベクトルのグループのいずれかにすることができます。

例:“年龄”

例:{“高度”,“体重”}

例:vartype(数字)

計算方法。次のいずれかとして指定します。

  • “和”——和

  • “的意思是”——平均値

  • “中值”——中央値

  • “模式”——最頻値

  • “var”——分散

  • “性病”——標準偏差

  • “最小值”——最小値

  • “马克斯”——最大値

  • “范围”——最大値から最小値を引いた値

  • “nummissing”——欠損要素の数

  • “nnz”——非ゼロと非要素の数

  • “所有”——前述のすべての計算

最初の次元の長さが1であるグループごとに1つのエンティティを返す関数ハンドルとして方法を指定することもできます。

一度に複数の計算を指定するには,{“的意思是”,“中等”}または{myFun1, myFun2}などのように细胞配列にオプションをリストします。

入力データが表Tであり,複数の入力引数を受け入れる方法の関数ハンドルを指定する場合,datavarsを指定しなければなりません。datavars引数は、细胞配列(その要素が,メソッドへの各入力に使用する表変数を示す)でなければなりません。グループ単位での関数の各呼び出しでは,入力引数は细胞配列の要素の対応する表変数です。以下に例を示します。

  • groupsummary (T groupvars @ (x, y) myFun (x, y),{“x1”、“日元”})は各グループのmyFun (T.x1 T.y1)を計算します。

  • groupsummary (T groupvars @ (x, y) myFun (x, y),{(“x1”“x2”)(“日元”“y2)})は最初に各グループのmyfun (T.x1 T.y1)を計算し,次に各グループのmyfun (T.x2 T.y2)を計算します。

入力データがベクトルまたは行列形式であり,複数の入力引数を受け入れる方法の関数ハンドルを指定する場合,入力データ一个はベクトルまたは行列の细胞配列でなければなりません。関数の各呼び出しでは、入力引数は cell 配列の各要素の対応する列です。以下に例を示します。

  • groupvars groupsummary ({(x1, y1)}, @ (x, y) myFun (x, y))は各グループのmyFun (x1, y1)を計算します。

  • groupsummary ({(x1, x2)), (y1 y2)}, groupvars, @ (x, y) myFun (x, y))は最初に各グループのmyFun (x1, y1)を計算し,次に各グループのmyFun (x2, y2)を計算します。

表入力または时间表入力のデータ変数。スカラー,ベクトル,细胞配列,関数ハンドル,またはvartype添字として指定します。datavarsはメソッドを適用する入力テーブルの変数を示し,次のオプションのいずれかにすることができます。

  • 単一の表変数名を指定する文字ベクトルまたはスカラー字符串

  • 各要素が表変数名である,文字ベクトルの细胞配列または字符串配列

  • 表変数インデックスのベクトル

  • 各要素が表変数に対応する逻辑ベクトル。真正的の場合は対応する変数を含めて,の場合は対応する変数を除外します。

  • 入力として表変数をとり,逻辑スカラーを返す関数ハンドル

  • 表格vartype添字

入力データが表Tであり,複数の入力引数を受け入れる方法の関数ハンドルを指定する場合,datavarsを指定しなければなりません。datavars引数は、细胞配列(その要素が,メソッドへの各入力に使用する表変数を示す)でなければなりません。グループ単位での関数の各呼び出しでは,入力引数は细胞配列の要素の対応する表変数です。以下に例を示します。

  • groupsummary (T groupvars @ (x, y) myFun (x, y),{“x1”、“日元”})は各グループのmyFun (T.x1 T.y1)を計算します。

  • groupsummary (T groupvars @ (x, y) myFun (x, y),{(“x1”“x2”)(“日元”“y2)})は最初に各グループのmyfun (T.x1 T.y1)を計算し,次に各グループのmyfun (T.x2 T.y2)を計算します。

datavarsが指定されない場合,groupsummaryはそれぞれの非グループ化変数に計算を適用します。

例:“利润”

例:{“收入”,“费用”}

例:@isnumeric

例:vartype(数字)

ビン化スキーム。次のいずれかのオプションとして指定します。

  • ビン化しないことを示す“没有”

  • 数値ベクトル,またはdatetimeベクトル(datetimeグループ化変数またはベクトルの場合)として指定されるビンエッジのリスト

  • 整数値スカラーとして指定されるビン数

  • ビンの幅を示す持续时间型またはcalendarDuration型のスカラーとして指定される時間範囲(datetimeまたは持续时间グループ化変数またはベクトルの場合のみ)

  • 次のいずれかの文字ベクトルとして指定される時間ビン(datetimeまたは持续时间グループ化変数またはベクトルの場合のみ)

    説明 データ型
    “第二”

    各ビンは1秒です。

    datetime持续时间
    “一分钟”

    各ビンは1分です。

    datetime持续时间
    “小时”

    各ビンは1時間です。

    datetime持续时间
    “天”

    各ビンは1カレンダー日です。この値には,夏時間のシフトが考慮されます。

    datetime持续时间
    “周” 各ビンは1カレンダー週です。 datetimeのみ
    “月” 各ビンは1カレンダー月です。 datetimeのみ
    “季” 各ビンは1カレンダー四半期です。 datetimeのみ
    “年”

    各ビンは1カレンダー年です。この値には,うるう日が考慮されます。

    datetime持续时间
    “十年” 各ビンは10年(10カレンダー年)です。 datetimeのみ
    “世纪” 各ビンは1世紀(100カレンダー年)です。 datetimeのみ
    “secondofminute”

    ビンは0から59までの秒です。

    datetimeのみ
    “minuteofhour”

    ビンは0から59までの分です。

    datetimeのみ
    “hourofday”

    ビンは0から23までの時間です。

    datetimeのみ
    “dayofweek”

    ビンは1から7までの曜日です。週の始まりは日曜日です。

    datetimeのみ
    “dayname” ビンは“星期天”などの完全な曜日名です。 datetimeのみ
    “dayofmonth” ビンは1から31までの日です。 datetimeのみ
    “dayofyear” 366年ビンは1からまでの日です。 datetimeのみ
    “weekofmonth” ビンは1から6までの週です。 datetimeのみ
    “weekofyear” ビンは1から54までの週です。 datetimeのみ
    “monthname” ビンは“1月”などの完全な月名です。 datetimeのみ
    “monthofyear”

    ビンは1から12までの月です。

    datetimeのみ
    “quarterofyear” ビンは1から4までの四半期です。 datetimeのみ

  • 各グループ化変数またはベクトルのビン化ルールをリストする细胞配列

複数のグループ化変数を指定する場合,すべてのグループ化変数に適用される1つのビン化ルールを指定するか,グループ化変数ごとのビン化メソッドが格納された细胞配列({'none',[0 2 4 Inf]}など)を指定することができます。

名前と値のペアの引数

オプションの名称,值の引数ペアをコンマ区切りで指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,複数の名前と値のペアの引数を任意の順序で指定できます。

例:G = groupsummary (T groupvars groupbins,‘IncludedEdge’,‘正确的’)

含めるビンエッジ。“左”または“对”のいずれかとして指定し,ビン区間のどちらの端が含まれるかを示します。

この名前と値のペアはgroupbinsが指定されている場合にのみ指定できます。この値は,すべてのグループ化変数またはベクトル,ですべてのビン化スキームに適用されます。

欠損グループインジケーター。真正的またはとして指定します。パラメーター値が真正的の場合,groupsummaryにはなどの欠損値で構成されたグループが表示されます。パラメーター値がの場合,欠損グループはgroupsummaryに表示されません。

データ型:逻辑

空のグループインジケーター。真正的またはとして指定します。パラメーター値がの場合,要素がゼロのグループはgroupsummaryに表示されません。パラメーター値が真正的の場合,groupsummaryには空のグループが表示されます。

データ型:逻辑

出力引数

すべて折りたたむ

出力表。グループ別に指定された計算が含まれる表として返されます。

出力配列。グループの計算が含まれるベクトルまたは行列として返されます。複数の方法を指定した場合,groupsummaryはリストされた順序で計算を横方向に連結します。

配列の入力データのグループ。グループ化ベクトルに対応する,列ベクトルまたは列ベクトルの细胞配列として返されます。

複数のグループ化ベクトルが使用されている場合,BGは長さが等しい列ベクトルを含む细胞配列となります。グループ情報を確認するには,BGのすべてのベクトルの要素を行単位で参照します。各グループは,出力配列Bの対応する行にマッピングされます。

配列の入力データのグループカウント。各グループの要素数が含まれる列ベクトルとして返されます。公元前の長さは,BGで返されるグループ列ベクトルの長さと同じです。

ヒント

  • groupsummaryを何度も呼び出す場合,可能であればパフォーマンス向上のためグループ変数を分类型または逻辑型に変換することを検討してください。たとえば,字符型のグループ化変数(要素が“男”“女”である性别など)がある場合,分类(性别)コマンドを使用してこれを直言値に変換することができます。

拡張機能

R2018aで導入