Creatorshead

株式会社クリエイターズ・ヘッドのつぶやき

データサイエンスは何でモデリングする?

ちまたではデータサイエンスという名のビッグデータ解析であったり、機械学習データマイニングといった形で統計解析のアルゴリズムを利用した分析(解析)が企業のデータ活用という側面で注目されています。

統計解析をシステム上でどう実現するか?という話では、弊社も取り扱っている「IBM SPSS」や「SAS」といった商用ツールを使うやり方とRやPythonといったオープンソースを利用した開発というやり方が主流です。

商用ツールは特に「IBM SPSS」はよくできていて、ノンプログラミングでモデル開発ができるだめプログラミングスキルのない方でも統計モデルが作れるのと、データサイエンティストのように統計解析の知識がなくても初心者でも統計解析モデルが作れるということで、プログラムスキルや統計スキルが無くても、誰でも統計解析ができるという目から鱗のツールです。またモデルの改修もGUIで簡単に再構築可能です!

しかしながら商用ツールは当然ライセンス費用というものが必要になるため、ここが高額だと、オープンソースでの開発のほうがコストメリットがあると判断されます。

但し、オープンソースの場合は、RやPythonの言語を使用したプログラム開発スキルが必要になりますし、モデル設計は統計解析の知識(データサイエンティスト)が必要になります。よって、通常のシステム開発プロジェクトと同様に要件定義や設計をするためのデータサイエンティストのコンサルティング工数やRやPythonでのプログラム開発工数が必要となりますし、モデル改修も容易ではなく、再コーディングが必要になります。

ここまで言えばお分かりかと思いますが、オープンソースでの統計解析モデルの開発は結果的にかなりの高コストが必要になることは間違いありません。宣伝になりますが「IBM SPSS」のライセンスコストは、想像されるよりもずっと割安ですし、しかも機能的にお得となれば使わない手はないと思います!

IBM SPSS」は弊社イチ推し製品でもありますので、デモを含め、ご興味ありましたら、お問い合わせください!