例えば、以下のようなデータがあったとする。
| 年 | 四半期 | 金額 |
|---|---|---|
| 2014 | 1 | 105 |
| 2014 | 2 | 106 |
| 2014 | 3 | 103 |
| 2014 | 4 | 98 |
| 2015 | 1 | 100 |
| 2015 | 2 | 101 |
| 2015 | 3 | 110 |
| 2015 | 4 | 109 |
人間には年別の四半期の何らかの金額を示していることがわかるが、コンピュータには単なるデータの羅列に過ぎない。つまりデータ上は「数字」としての並びがあるだけでそれは時間的な経過を意味していない。
> sales <- c(105,106,103,98,100,101,110,109)
> sales
[1] 105 106 103 98 100 101 110 109
> sales.time <- ts(sales, start=c(2014,1), frequency=4)
> sales.time
Qtr1 Qtr2 Qtr3 Qtr4
2014 105 106 103 98
2015 100 101 110 109
とこのようになる。
startはデータの時系列の始まりを表し、単独の数字ないしは複数の組み合わせからなる。
例えば2014年第二四半期からのデータとしたければ、
> sales.time <- ts(sales, start=c(2014,2), frequency=4)
> sales.time
Qtr1 Qtr2 Qtr3 Qtr4
2014 105 106 103
2015 98 100 101 110
2016 109
frequencyは時間単位(行)あたりの観測値の数を表す。4が四半期で、12が月のようだ。
参考までに、frequencyの値を12に変えてみる。
> sales.time <- ts(sales, start=c(2014,1), frequency=12)
> sales.time
Jan Feb Mar Apr May Jun Jul Aug
2014 105 106 103 98 100 101 110 109
>
startを4にすると、日本の年度になる。
> sales.time <- ts(sales, start=c(2014,4), frequency=12)
> sales.time
Apr May Jun Jul Aug Sep Oct Nov
2014 105 106 103 98 100 101 110 109
>
startベクトルの2番目の数字は、frequencyの値によって解釈が変わるようになっている。
| frequency | start2項目の解釈 | 表記 |
|---|---|---|
| 12 | 月 | Jan/Feb/Mar/Apr.... |
| 4 | 四半期 | Qtr1/Qtr2... |
| 52 | 週次 | なし |