主要内容

。

离散化

データをビンまたはカテゴリにグループ化

説明

Y=离散化(X边缘は,Xのの要素を含む含むビンインデックスを返し返しj番目のビンには,1 <= j < N边缘(j)<= x(i)<边缘(j + 1)の場合に要素x(i)が含まれます。ここで,Nはビン数であり,长度(边缘)= n + 1です。最后最后のビンに,边缘(n)<= x(i)<=边缘(n + 1)を満たす両侧のエッジが含まれます。

YE] =离散化(XNは,X内のデータをN個の一様な幅のビンに分割し,さらにビンエッジEををます。

YE] =离散化(Xdは,datetime配列Xまたは持续时间配列Xを,時間の長さがdの一様なビンににしし。dは,スカラーの持续时间,スカラーの日历または時間の単位にすることができます。たとえば,[y,e] =离散化(x,'小时')は,Xを持续时间が1时间の一流なビンににします。

___] =离散化(___价值は,前述前述の力量引または力次数の任意の合数の任意のわせわせを使て,ビン番ではなくではなく,价值内内の対応する要素を返し返し返したとえば,X (1)がビン5にあるある合,Y (1)5ではなく,价值观(5)です。价值は,ビン数と同じ長さをもつベクトルでなければなりません。

___] =离散化(___“分类”)は,各ビンがカテゴリとなる分类配列を作用成しますほとんどの合,既定のカテゴリ名のの形式“[A, B)”(最後のビンでは”[A, B]”)です。ここで,一个Bは连続するビンエッジです。dを文字ベクトルとして指定すると,既定のカテゴリ名が特殊な形式になる場合があります。表示形式のリストについては,Yを参照してください。

___] =离散化(___“分类”,displayformat.は,DATETIMEまたは持续时间配配力のの合并,指定指定れたDATETIMEまたは持续时间のの表示形式をを出出にに使使使使使使。

___] =离散化(___“分类”,类别名称も,文字ベクトルの细胞配列类别名称をを用してYのカテゴリに名前を付けます。类别名称の长さはビンととなければなりません。

___] =离散化(___“IncludedEdge”,一边は,各ビンに右側または左側のビンエッジのいずれを含めるかを指定します。ここで,一边“左”または'对'です。たとえば,一边'对'の場合,両側のエッジを含む”最初”のビンを除く各,右侧右侧のビンエッジが含まれれ。边(j) < X(i) <=边(j+1)であれば,j番目のビンは要素x(i)を含みます。ここここ,1 であり,Nはは数。最初のビンは,边缘(1)<= x(i)<=边缘(2)を満たす左侧エッジをますます。一边の既定値は“左”です。

すべて折りたたむ

离散化を使用して数値を離散的なビンにグループ化します。边缘は5つのビンエッジを定义ため,4つのビンがあり。

数据= [1 1 2 3 6 5 8 10 4 4]
data =1×101 1 2 3 6 5 8 10 4 4
边缘= 2:2:10
边缘=1×52 4 6 8 10
Y =离散化(数据、边缘)
y =1×10南楠1 1 3 2 4 4 2 2

Yは,データの各要素が属するビンを示します。値1はビンの範囲外にあるため,Yににはそれらのの要素対応対応値が含まれています。

乱数データを3つのつのにグループグループます。离散化で計算されたビンエッジを返すための2番目の出力を指定します。

x = randn(10,1);[y,e] =离散化(x,3)
y =10×12 2 1 2 2 1 1 2 3 2
E =1×4.3 0 3 6

2016年内の乱数の日付をもつ10行1列のdatetimeベクトルを作成します。次に,datetime値を月別にグループ化し,結果を直言配列として返します。

X = DateTime(2016,1,Randi(365,10,1))
X =10 x1 datetime24- 10 -2016 26- 11- 2016 16- 2 -2016 29- 11- 2016 18- 8- 2016 05- 2 -2016 11- 4- 2016 18- 7 -2016 15- 12 -2016 18- 12 -2016
Y =离散化(X,'月''分类'
y =10x1分类2016年10 -2016年11 -2016年2 -2016年11 -2016年8 -2016年2 -2016年4 -2016年7 -2016年12 -2016年12月

持续时间値を時間別にグループ化し,その結果をさまざまな表示形式で返します。

持续时间値を时空别に,结果结果分类配列としてます。

X =小时(abs (randn(10)))”
X =10 x1持续时间0.53767 HR 1.8339 HR 2.2588 HR 0.86217 HR 0.31877 HR 1.3077 HR 0.43359 HR 0.34262 HR 3.5784 HR 2.7694 HR
Y =离散化(X,'小时''分类'
y =10x1分类[0 hr, 1 hr) [1 hr, 2 hr) [2 hr, 3 hr) [0 hr, 1 hr) [1 hr, 1 hr) [0 hr, 1 hr) [0 hr, 1 hr) [0 hr, 1 hr) [0 hr, 1 hr) [3 hr, 4 hr] [2 hr, 3 hr)

结果结果の表示をを単位のに変更ししの値に変更し

Y =离散化(X,'小时''分类''M'
y =10x1分类[0分钟,60分钟)[60分钟,120分钟)[120分钟,180分钟)[0分钟,60分钟)[0分钟,60分钟)[60分钟,60分钟)[0分钟,60分钟)[0分钟,60分钟)[180分钟,240分钟][120分钟,180分钟)

形式を再び変更して,時,分および秒の値として表示します。

Y =离散化(X,'小时''分类''hh:mm:ss'
y =10x1分类(就是01:00:00)[01:00:00 02:00:00)[02:00:00 03:00:00)[就是01:00:00)[就是01:00:00)[01:00:00 02:00:00)[就是01:00:00)[就是01:00:00)[03:00:00 04:00:00][02:00:00 03:00:00)

价值各ビンのの値は,ビンの値未満は,ビンの値未満。

x = randi(100,1,10);边缘= 0:25:100;值=边缘(2:结束);y =离散化(x,边,值)
y =1×10100 100 25 100 75 25 50 75 100 100

'储存指德'入各に右のますをビンは両侧の含まれれますます含まれ。ます。

x = 1:2:11;边缘= [1 3 4 7 10 11];Y =离散化(X,边缘,'储存指德''对'
y =1×6.1 1 3 3 4 5
z =离散化(x,边)
z =1×6.1 2 3 4 4 5

数字データを分类配列配列にグループしし。结果结果使使し,平台値の1标准偏差内ののデータデータのますますしししますますし。

标准偏差で测定され均均値てて,正规,正式分布データビンにににににににににしグループグループグループグループグループししし

X = randn (1000 1);边缘=性病(X) *(三3);Y =离散化(X,边缘,'分类'......'-3sigma'“2σ”'-sigma'“σ”“2σ”“3σ”});

Yに含まれる未定义の分类値は,平台値から标准の3倍を超えて离れたXの要素に対応します。

Yの値をプレビューします。

Y (1:15)
ans =15 x1分类西格玛2西格玛-3西格玛-2西格玛-西格玛<未定义> 3西格玛-2西格玛<未定义>西格玛-西格玛

データの約68%が平均値から1標準偏差内にあることを確認します。

nnz(y =='-sigma'|Y ==.“σ”)/ numel(y)
ans = 0.6910

入力数

すべて折りたたむ

ベクトル,行,行程更多次配列として指定ます。Xにはビンににするが含ま含まます。

データ型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64|逻辑|datetime|持续时间

ビンビンエッジエッジもつとしてエッジにします。边缘の連続要素は,Xのデータを分割するために离散化既定では,最后のエッジをます含み左侧はをますエッジを左侧ます含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含み含みででで両侧含み含み含み含みででは両侧含み含みででで両侧両侧含み含みででの両侧両侧ををでは両侧両侧ををではははをををでをををををますををでで形ををビンビンをでででをででででででで形でででででででででででででででででででででででででででで

边缘には,要素が少なくとも2つなければなりません。これは,边(1)が最初のビンの左側のエッジ,边缘(结束)が最後のビンの右側のエッジであるためです。

例:Y =离散化([1 3 5],[0 2 4 6])は,値13.5を,それぞれ(0, 2)(2、4)[4,6]のエッジをもつ3つのビンに分配します。

データ型:单身的|双倍的|INT8.|int16|INT32.|INT64.|uint8.|uint16|UINT32.|UINT64|逻辑|datetime|持续时间

ビンの数。スカラー整数として指定します。

离散化は,データをN個の一様な幅のビンに分割し,データの範囲とオーバーラップする”きりのよい”数字になるように,ビンエッジを選択します。Xの最大および最小の要素は,通常はビンエッジと一致しません。データが不均等に分散している场合,中间のいくつかのビンは空になることがあります。ただし,最初のビンと最后のビンは,常に1つ以上のを含みます。

例:[y,e] =离散化(x,5)は,Xののデータを均な幅ののののビンにしし。

一様なビンの期间。スカラースカラー持续时间,スカラーの日历または表の値のいずれかとして指定します。

dををする场合,离散化は最大65536個(216.)ののを使使ます。指定指定したビンビンののの间多くのビン必要となる合书,离散化は最大のビン数に対応する,より大きいビンの幅を使用します。

対応する入力 説明
“第二”

datetimeまたは时间の値

各ビンは1秒です。

“一分钟”

datetimeまたは时间の値

各各ビン1分です。

'小时'

datetimeまたは时间の値

各ビンは1时间です。

'天'

datetimeまたは时间の値

  • DateTime入力の综合,各ビンは1カレンダー日です。この値には,夏时间のシフトが考虑れれます。

  • 持续时间触力のの合,各ビンは固定のの1日(24时间)です。

'星期'

DateTime値

各ビンは1カレンダー周です。
'月'

DateTime値

各ビンは1カレンダー月です。
'四分之一'

DateTime値

各ビンは1カレンダー四半期です。
'年'

datetimeまたは时间の値

  • DateTime入力の合成,各ビンは1カレンダー年です。この値には,うるう日が考虑さます。

  • 时间入力の場合,各ビンは固定長の1年(365.2425日)です。

“十年”

DateTime値

各ビンは10年(10カレンダー年)です。
'世纪'

DateTime値

各ビンは1世紀(100カレンダー年)です。

例:[y,e] =离散化(x,'小时')は,Xを持续时间が1时间の一流なビンににします。

データ型:char|持续时间|日历

ビンの値。任意任意のデータ型のベクトル指定しし价值の长さはビン数长度(边缘)1と同じでなければなりません。出力の通常のビンのインデックスが价值のの要素に置き换えられられつまり,X (1)がビン2に含まれる場合,离散化Y (1)を,2ではなく值(2)としてとしてます。

价值が细胞配列の場合,すべての入力データが1つのビンに属していなければなりません。

例:Y =离散化(randi(5,10,1),[1 1.5 3 5],diff([1 1.5 3 5]))は,1から3のインデックス,ビンの幅を返し。

datetimeと时间の表示形式。文字ベクトルとして指定します。displayformat.の値はYの値を変更せず,表示のみを変更します。datetime配列と duration 配列の有効な表示形式を使用して、displayformat.を指定できます。使用可能なオプションの詳細については,日付と時刻の表示形式の設定を参照してください。

例:离散化(X,“天”、“分类”,“h”)は、持续时间配列の表示形式を指定します。

例:离散化(X,“天”、“分类”、“yyyy-MM-dd”)は,DateTime配列配列の表示形式指定しし

データ型:char

分类配列配列の名。文明ベクトルの细胞配列として指定します。类别名称の长さはビンととなければなりません。

例:Y =离散化(Randi(5,1.10,1),[1 1.5 3 5],'分类',{'a'b''c'})は,データを3つのカテゴリ一个BおよびCに分享します。

データ型:细胞

各ビンにエッジ。次次の値のいずれいずれとして指定しししてしてしししして指定しし

  • “左”- 両侧の除いて,すべてのビンますのが既定れ。

  • '对'——両側のエッジを含む最初のビンを除いて,すべてのビンに右側のビンエッジが含まれます。

例:Y =离散化(Randi(11,10,1),1:2:11,'已加工指g','右')は,各ビンに右側のビンエッジを含めます。

出力数

すべて折りたたむ

ビン。数値ベクトル行,列,多次元配列または順序分类配列として返されます。YのサイズはXと同じで,各要素はXの対応する要素のビンの配置を表します。价值が指定されてている合书,Yのデータ型は价值范囲外の要素表现,出力のデータ型によって异なりなり。

  • 数値出力の場合,Yは,Xに范囲外の要素(X(我)<边缘(1)またはx(i)>边缘(结束))がある場合,あるいはXが含まれる場合に,値を含みます。

  • Yが直言配列である場合,範囲外の入力またはのの力に対して,未定义の要素を含み。

  • 价值がが数データ型ののであるである场合,范囲外のの力またはの入力に対して,Y0ををます。

構文离散化(x,dur,'分类')のの合,Yのカテゴリ名称のの形式は次のとおりです。

dの値 カテゴリ名の既定の形式 形式の例
“第二”

グローバルな既定の形式

28 - 1月- 2016 10:32:06

“一分钟”
'小时'
'天'

グローバルな既定の日付形式

28日- 1月- 2016

'星期'

[global_default_date_format, global_default_date_format)

[24 - 1月- 2016年1月30 - - 2016)

'月'

“MMM-uuuu”

2016年6月

'四分之一'

'qqq uuuu'

Q4 2015

'年'

'uuuu'

2016

“十年”

”(哦哦哦哦)

(2010, 2020)

'世纪'

ビンエッジ。ベクトルとして返されます。ビン エッジが明示的に渡されない場合に离散化が計算したビンエッジを確認するには,この出力を指定します。

Eは,离散化がビンのエッジを計算するたびに行ベクトルとして返されます。ビンのエッジを渡す場合,E边缘入力の方向を保持します。

ヒント

  • 离散化の动作は,关节histcountsの动作と似似ていいにビンの要素をににににににhistcountsを使用します。一方,各要素が属するビンを調べる(要素数のカウントはしない)には,离散化を使用します。

拡张机械

C / C ++コード生成
MATLAB®Coder™をを使てcおよびc ++コード生成します。

R2015Aで导入