GRANVALLEY
データであなたの「ミチ」をてらす

GRANVALLEY

ブログBlog

無料の統計ソフト『R』 ~ Rの概要とデータの取り込み編 ~

R とは

R とはニュージーランドとオークランド大学の Ross Ihaka と Robert Clifford Gentlemanによって開発された統計ソフトです。開発者お二人の名前の頭文字が「R」であったことからその名前がつけられました。また R は無料で利用できるフリーの統計ソフトです。市販の統計ソフトが有料かつ高価なのに対し、R は無料で利用できるため世界中の研究者や学生に利用されています。そのため R に関連する参考書籍や Web サイトも多く存在し、R の使い方の習得や統計学の勉強に非常に有利です。さらにはパッケージによる拡張機能も備えており、有志により作成されたパッケージを追加導入することで、個別分野の統計手法や新しい関数を利用することができます。

 R のインストールと操作

それでは早速 R をインストールして使ってみましょう!

Rのインストール

ここでは、Windows を基本に記述します。

http://cran.ism.ac.jp/

上記のサイトから「Download R for Windows」を選択し、

r_001

「base」リンクを選択。

r_002

画面が切り替わった先の「Download R 3.2.2 for Windows」から exe をダウンロードし、インストールできます。

r_003

R による分析方法『広告費と来客数を使った単回帰分析』

では実際に操作しながら、R について分析及び評価を行っています。

今回は下記のデータの広告費と来客数の 2 つの変数の相関関係を、単回帰分析を用いて調べてみます。

r_004

まずは、Microsoft Excel データを R に取り込みます。しかし、インストール直前の状態では、エクセルデータを取り込む機能は R にありません。そこで Microsoft Excel を取り込む機能を追加するためにパッケージをインストールします。

R の操作は、全て命令をキーボードから入力することで実行します。

処理の実行は、命令を入力し、エンターを押す事で、処理が実行されます。

 r_005

下記の命令では、R にエクセルを取り込む機能をインストールします。

> Install.packages (“xlsx”, dependencies = TRUE )

パッケージをインストールした後、下記のコマンドを実行し、エクセルのデータをRに取込みます。

ここでは、ファイル data1.xlsx のシート 1 をユニコード形式で取り込み、変数 x に格納します。

> library(xlsx)
> x = read.xlsx(“C:\OSDisc\datal.xlsx”,sgeetIndex=1,encoding=”UTF-8”)

※マイクロソフトアクセスやデータベースのデータも R に取り込む事ができます。それには、それぞれのファイルに対応したパッケージを追加インストールする必要があります。

データが取り込めているかを確認するには、変数名を入力し、エンターを押すと、値が表示されます。

今回は、データの取り込みまで行いました。
次回は、取り込んだデータを元に、単回帰分析を行っていきます。

 

※ Microsoft、MS、Windows、Windows Serverは、米国 Microsoft Corporationの米国およびその他の国における登録商標です。
※ Windows の正式名称は、Microsoft Windows Operating System です。
※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。