ts()
データに「時系列」という属性を与える。
例えば、以下のようなデータがあったとする。
年 | 四半期 | 金額 |
---|---|---|
2014 | 1 | 105 |
2014 | 2 | 106 |
2014 | 3 | 103 |
2014 | 4 | 98 |
2015 | 1 | 100 |
2015 | 2 | 101 |
2015 | 3 | 110 |
2015 | 4 | 109 |
人間には年別の四半期の何らかの金額を示していることがわかるが、コンピュータには単なるデータの羅列に過ぎない。つまりデータ上は「数字」としての並びがあるだけでそれは時間的な経過を意味していない。
> sales <- c(105,106,103,98,100,101,110,109) > sales [1] 105 106 103 98 100 101 110 109 > sales.time <- ts(sales, start=c(2014,1), frequency=4) > sales.time Qtr1 Qtr2 Qtr3 Qtr4 2014 105 106 103 98 2015 100 101 110 109
とこのようになる。
start属性
startはデータの時系列の始まりを表し、単独の数字ないしは複数の組み合わせからなる。
例えば2014年第二四半期からのデータとしたければ、 > sales.time <- ts(sales, start=c(2014,2), frequency=4) > sales.time Qtr1 Qtr2 Qtr3 Qtr4 2014 105 106 103 2015 98 100 101 110 2016 109
frequency属性
frequencyは時間単位(行)あたりの観測値の数を表す。4が四半期で、12が月のようだ。
参考までに、frequencyの値を12に変えてみる。
> sales.time <- ts(sales, start=c(2014,1), frequency=12) > sales.time Jan Feb Mar Apr May Jun Jul Aug 2014 105 106 103 98 100 101 110 109 >
startを4にすると、日本の年度になる。
> sales.time <- ts(sales, start=c(2014,4), frequency=12) > sales.time Apr May Jun Jul Aug Sep Oct Nov 2014 105 106 103 98 100 101 110 109 >
startとfrequencyとの関係
startベクトルの2番目の数字は、frequencyの値によって解釈が変わるようになっている。
frequency | start2項目の解釈 | 表記 |
---|---|---|
12 | 月 | Jan/Feb/Mar/Apr.... |
4 | 四半期 | Qtr1/Qtr2... |
52 | 週次 | なし |
残念だが以下のデータには対応していないようだ。
- 上期・下期
- 日次(おそらく日付型データで対応が可能なので用意されていない)
Last updated 2015-12-20 | auditR (c) N.Nawata