トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

R使用上の注意

auditR

入力時の注意

以下は自分がよくやる凡ミスです。

大文字小文字を使い分ける

Rのオブジェクトや関数は、大文字と小文字を別の文字として扱います。ゆえに、「綴り方はあっているのにエラーメッセージが出る」ときには、関数の中に大文字が入っていないか注意しましょう。

全角半角を使い分ける

Rのオブジェクトは全角文字でも受け付けられます。個人的には漢字表記は分かりやすくて好きなのですが、ことコマンドラインでの入力(CUI)環境では、漢字入力はFEPの切り替えがとても煩わしいものでもあり、データ以外のところでは半角英数を使ったほうが入力に関しては楽です。ひらがなや漢字は基本的には全角文字なので半角と間違うことはありませんが、こと英文字となると最近のフォントによっては、全角・半角が一目ではよく分からないものがあります。

マイナス数値は明示的にマイナスであることを教える。
obj  <-  100  #(1)
obj <-100   #(2)

(1)は、objには100が代入されることは明白ですが、それでは(2)はどうでしょうか。

objがマイナス100より小さいかどうかを示したいのであれば、不等号と負記号との間にスペースを入れます。

しかしもっと明示的にしたければ、−100を括弧で囲めばわかりやすいでしょう。

obj <(-100)
単数形複数形は違う意味

Rの関数につけられる名前は英単語を用いられることが多いですが、複数形の関数は注意しましょう。

よく間違ってRに叱られる関数

NG ではなく OK
install.package() ではなく install.packages()

あくまでも筆者の場合です。

メモリ限界に注意

Rは非常に処理速度が速く、ストレスなく動いてくれますが、これは処理に必要な関数やデータをメモリに一括して読み込んで処理しているため、メディアへの物理的なデータアクセスが最初のデータ読み込みの際だけだからです。

Windows7などで32ビットOSを使っていれば、OSが認識するメモリ範囲は4GBが上限で、うち2GB程度はOS自体が使ってしまうので、ユーザが使える領域は残りの2GBくらいになります。

データの容量は処理の内容にもよりますが、あまりに大きなデータを処理する場合には、メモリへの負荷を考えてください。経験上は数十メガ単位のデータを扱っても、まず、1Gのメモリを消費することはありませんが、Rと一緒に他のアプリケーションが動いていることも多いですから、あくまでもRだけではなく利用している環境全体で考えてください。


Last updated 2015-05-24 | auditR (c) N.Nawata