Anacondaを使わずにPythonでデータ解析・機械学習する方法

Anaconda が、ある条件のもとで有償化されています。

参考: https://qiita.com/tfukumori/items/f8fc2c53077b234384fc

原文: https://www.anaconda.com/blog/sustaining-our-stewardship-of-the-open-source-data-science-community

 

個人的な趣味で Anaconda を利用したり、大学や研究所において教育・研究するために Anaconda を用いたりするときは問題ないと思いますが、例えば企業において使用するとき、場合によっては有償ライセンスを使用する必要があるかもしれません。もちろん、Anaconda は便利であり、有償であっても利用する価値はあると思います。

ただ一方で、いろいろな理由で有償ライセンスを導入できないことがあるかもしれません。金子研ウェブサイトではこれまで Anaconda をオススメしており、

Anaconda のインストールから jupyter notebook の起動まで (Windows編とmacOS編)
Python でプログラミングするときの事前準備の話です。Anaconda をインストールして jupyter notebook を使いたい方はぜひご覧ください。Windows 編と macOS 編があります。ご自身の OS にあわせてどう...

 

過去の著書でも基本的に Anaconda を導入してあることが前提でしたが、

[無料公開] 「化学のためのPythonによるデータ解析・機械学習入門」 の “はじめに” と目次の詳細
こちらの書籍には改訂2版がございます。改訂2版でも無料公開の部分の内容は変わらない一方で、一章分+α を改訂2版では追記しておりますので、以下で興味を持っていただけましたら、改訂2版の購入をオススメいたします。2019 年 10 月 23 ...
[無料公開] 「Pythonで気軽に化学・化学工学」 の “まえがき”、目次の詳細、第1・2・3章
2021 年 5 月 1 日に、金子弘昌著の「Pythonで気軽に化学・化学工学」が出版されました。丸善: Amazon: Amazon(Kindle): こちらの本は、前著の 「化学のための Pythonによるデータ解析・機械学習入門」 ...
[無料公開] 「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」 の “まえがき”、目次の詳細、第1・2章
2021 年 6 月 3 日に、金子弘昌著の「Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析」が出版されました。講談社: Amazon: Amazon(Kindle): === 出版して約2年経過した 2023 年 4 月 ...

 

ここでは Anaconda を導入すること以外の方法で、Python でデータ解析・機械学習をする方法を説明します。ここで 「データ解析・機械学習をする」 というのは、基本的には金子研ウェブサイトの記事で書いてあるようなこと (回帰分析、クラス分類、特徴量選択など) を実現したり、上の著書の内容を行ったりすることになります。上の著書のサンプルプログラムを実行する、と読みかえていただいても OK です。

方法は以下の2通りがあります。

 

  1. Miniconda をインストールしてから、conda-forge で必要なライブラリ・パッケージをインストールする
  2. Miniforge をインストールしてから、必要なライブラリ・パッケージをインストールする

 

どちらでも OK ですが、どちらかと言えば 2. のほうが手順が簡単かと思います。順に説明します。

 

1. Miniconda をインストールしてから、conda-forge で必要なライブラリ・パッケージをインストールする

1-1. Miniconda のインストール

まず、こちら https://docs.conda.io/en/latest/miniconda.html から、お使いの OS (Windows, MacOSX, Linux) にあったものを選んで、Miniconda3 をダウンロード、インストールします。

1-2. conda-forge からインストールをする設定に変更

Miniconda のインストールが完了したら、必要なライブラリ・パッケージを conda-forge からインストールします。

まずは conda-forge からインストールする設定にします。Anaconda Prompt (Windows) やターミナル (MacOS) を起動して、

 

conda config --append channels conda-forge

 

を実行しましょう。また以下を実行して anaconda の default のチャネルを使わないよう設定してください。

 

conda config --remove channels defaults

 

1-3. 必要なライブラリ・パッケージのインストール

続いて、必要なライブラリ・パッケージをインストールします。以下を実行しましょう。

 

conda install -y numpy pandas scipy matplotlib seaborn scikit-learn boruta_py lightgbm xgboost deap rdkit jupyter notebook jupyterlab spyder

 

=== 補足 ここから ===

y オプション (-y) について、これがないと途中で Proceed ([y]/n)? と聞かれます。「y」と入力して Enter キーを押してください。y オプションをつけることで、確認のプロセスを省略できます。

=== 補足 ここまで ===

 

ここでは以下のライブラリ・パッケージをインストールしています。

 

2. Miniforge をインストールしてから、必要なライブラリ・パッケージをインストールする

2-1. Miniforge のインストール

まず、こちら https://github.com/conda-forge/miniforge から、Download や Miniforge3 を探し、Miniforge3 の中からお使いの OS (Windows, MacOSX, Linux) にあったものを選んでダウンロードし、インストールします。

 

2-2. 必要なライブラリ・パッケージのインストールする

続いて、Miniforge3 Prompt (Windows) [Anaconda Prompt ではありません] やターミナル (MacOS) を起動して、「1-3. 必要なライブラリ・パッケージのインストール」 と同様にインストールしてください。

なお、Miniforge3 では、最初から conda-forge でインストールする設定になっていますので、「1-2. conda-forge からインストールをする設定に変更」 は不要です。

 

おわりに

1. 2. のどちらの方法で行った場合も、最後に、

 

pip install dcekit

 

を実行して、ぜひ DCEKit をインストールして、ご活用いただければと思います!

DCEKit (Data Chemical Engineering toolKit) を PyPI にリリース!
これまで化学データ・化学工学データのデータ解析に役立つツールや金子研で開発された手法に関する Python コードを Github にて公開してきました。このたびは、これらのツール・手法 (の一部) に加えて、新たな機能を追加して、DCEK...

 

以上です。

質問やコメントなどありましたら、twitter, facebook, メールなどでご連絡いただけるとうれしいです。

タイトルとURLをコピーしました