書評: R In Action

R言語の勉強を始めました。R言語が仕事上これといって必要だったというわけではないのですが、ふと今話題の統計処理用のプログラム言語に興味が出てきて、一冊本を買って読み始めました。実はまだ読み終えていないのですが、読み終える頃には「R言語はリーンシックスシグマで使えるのか」という自らの問いに、ある程度自分なりの答えが見出せているのではないかと思います。

リーンシックスシグマでは色々な統計処理を行います。実際「リーンシックスシグマ=統計処理」と思っている人もたくさんいます。リーンシックスシグマで統計処理を行う以上、「R言語はリーンシックスシグマで使えるのか」という問いの答えはもちろん YES なのですが、問題はどのくらい便利なのかということです。

リーンシックスシグマで定番の統計処理ソフトウェアと言えば Minitab で、もちろん僕も Minitab を使っています。Minitab は非常に優れたユーザー・インターフェースとヘルプ機能を持っているため、統計処理がとても楽に、そして簡単に行えます。リーンシックスシグマには Minitab が最適で、また機能的にも十分です。そのためか、リーンシックスシグマのトレーニングや書籍などは、Minitab を使うことが前提となっているものが多いようです。

ではなぜ R言語に興味を持ったかというと、それはやはりオープンソース(無料)の統計処理プログラミング言語だったからです。

本の概要(裏表紙から)

R In Action: Data analysis and graphics with R

  • By Robert I. Kabacoff (2015)
  • ISBN-13: 978-1-617291-38-8
  • ISBN-10: 1-617291-38-8

実業家や研究者は、データ解析によって成功しています。そして R はそれらデータ解析者の言葉を話します。R は統計処理のためのパワフルなプログラミング言語なのです。

他の汎用的ツールと異なり、R はあなたが日々直面している膨大なデータ分析やデータ表現といった問題に応えるために、数千ものモジュールを提供しています。

R は主要なすべてのコンピュータ・プラットフォームで動きます。そして数千にもおよぶ世界中の主要な会社や研究所で使われています。

この本は、多くの例題を使って、サイエンスや技術、ビジネス開発者向けに R言語を教えてくれます。実用的な問題解決方法に焦点を当て、不完全なデータを処理するための方法についても、科学的かつ巧妙な手法とともに、この本は短いコースの中で説明してくれます。

R が持つグラフィック機能やデータ表現についてもマスターできます。さらにこの本はデータ探索、データ予想やレポーティング機能についても書かれています。〔ママ〕

あくまで個人的な書評

リーンシックスシグマの仕事を始める前は、20年以上もの間ソフトウェア・エンジニアでした。仕事で使ったプログラミング言語は、COBOLから始まり、LISP、Ada、アセンブラ、 C、C++、MATLAB/Simulink、Python と多岐に渡ります。学校や趣味で扱った言語、Java、C#、VBA なども入れたらずいぶんたくさんのプログラミング言語を学びました。そもそもプログラミング言語を学ぶことは好きな方です。しかしここ最近はプログラミングから距離を置いていたため、R 言語は久しぶりに新しく学ぶ言語となりました。

この本は R言語を一から始め、かつ全体を網羅してくれるものと期待して読み始めました。R言語を一から始めるといっても、この本はプログラミングの基礎などについてはあまり触れないため、本題にすっと入ってくれます。そこが「経験者?」の僕としてはこの本の嬉しいところです。元ソフトウェア・エンジニア現リーンシックスシグマ実践者の僕としては、今のところこの本にとても満足しています。

Top Ten Programming language

本とは関係ありませんが、上の図は IEEE Spectrum が発表した最も利用されているプログラミング言語のトップ 10 です( 2017 年 )。R 言語以外は個人的には上位 7 位まですべて使ったことがあります。

R 言語は統計処理用のプログラミング言語ですが、どうしてこんな上位に食い込んでいるのでしょうか。ビッグ・データの時代だからでしょうか。とても意外です。

統計処理用のプログラミング言語と言えば高価な SAS だと思っていたのですが、下の図を見ると最近は(と言っても KDnuggets からお借りした 2014 年のデータですが)僕の古いイメージとはずいぶんと違っていたようです。

Statistical Programming language

統計処理・データ解析用のプログラミング言語だけに限っては、R 言語は今や最も使われているプログラミング言語のようです。知りませんでした。これを見るとリーンシックスシグマを生業としている者として、R 言語を知らないことはとても恥ずかしいことのように思えてきます。

これを機に、R言語をしっかり身につけて仕事に活かしてみようと思います。そしてもしできれば近いうちにリーンシックスシグマと R言語について書いてみたいと思います。