rdkit
多様性を保ちながらできるだけコンパクトに あなたは大規模な化合物データセットからin silicoスクリーニングを行い、有望な5000化合物のリストを作成しました。 しかし、この化合物リストをアッセイ担当の研究者に渡すと 「5000化合物もアッセイできるわけ…
LIMEというモデル解釈ツールを使用してDeepChemで作成した回帰モデルの解析を行います。 本稿はDeepChemのモデル解釈チュートリアルを参考に作成しています。 ※化合物ではなく一般的なテーブルデータから作成されたモデルにLIMEを適用する例は下記を参照くだ…
kaggleで大人気のxgboostもDeepchemで使用することができます。 XGBoost Documentation — xgboost 0.80 documentation 準備 例によってdelaney水溶解度データセットを読み込みます。featurizerは適当にRDKitDescriptors()にしました。 import deepchem as dc…
分子グラフの畳み込みモデルでdelaney-水溶解度データセットの回帰を行います。 csvデータのロード 例のごとくdelaney水溶解度データセットをロードします。 MPNNモデルやCoulomb matrix featurizerなどを使いたい場合は立体構造が必要ですが、ConvMolFeatur…
RDkitで各種の分子フィンガープリントの生成を行います。 マルチSDF読み込み delaney水溶解度データセットから作成したマルチSDFを読み込みます。 horomary.hatenablog.com from rdkit import Chem mols = Chem.SDMolSupplier('delaney_multi.sdf') for mol …
SDF形式にすることで、立体構造を要求する処理が可能になるのはもちろんですが、目的変数と化合物構造を紐づけておくことができるので間違いが起こりにくいという利点があります。 サンプルデータ 例のごとくdeepchem付属のdelaney水溶解度データセットを使…
症状 久々にrdkitをインストールしようとしたらModuleNotFoundError In [1]: import rdkit --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython-input-1-6b72bd8913ab> in <module>() ----> 1 import rd</module></ipython-input-1-6b72bd8913ab>…