どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

rdkit

RDkitで分子骨格に基づく化合物セットのクラスタリング

多様性を保ちながらできるだけコンパクトに あなたは大規模な化合物データセットからin silicoスクリーニングを行い、有望な5000化合物のリストを作成しました。 しかし、この化合物リストをアッセイ担当の研究者に渡すと 「5000化合物もアッセイできるわけ…

DeepChemによる化合物フィンガープリント-水溶解性回帰モデルをLIMEで解析

LIMEというモデル解釈ツールを使用してDeepChemで作成した回帰モデルの解析を行います。 本稿はDeepChemのモデル解釈チュートリアルを参考に作成しています。 ※化合物ではなく一般的なテーブルデータから作成されたモデルにLIMEを適用する例は下記を参照くだ…

Deepchem④(XGBで回帰)

kaggleで大人気のxgboostもDeepchemで使用することができます。 XGBoost Documentation — xgboost 0.80 documentation 準備 例によってdelaney水溶解度データセットを読み込みます。featurizerは適当にRDKitDescriptors()にしました。 import deepchem as dc…

Deepchm③(グラフ畳み込みで回帰)

分子グラフの畳み込みモデルでdelaney-水溶解度データセットの回帰を行います。 csvデータのロード 例のごとくdelaney水溶解度データセットをロードします。 MPNNモデルやCoulomb matrix featurizerなどを使いたい場合は立体構造が必要ですが、ConvMolFeatur…

RDkitで分子フィンガープリントの生成

RDkitで各種の分子フィンガープリントの生成を行います。 マルチSDF読み込み delaney水溶解度データセットから作成したマルチSDFを読み込みます。 horomary.hatenablog.com from rdkit import Chem mols = Chem.SDMolSupplier('delaney_multi.sdf') for mol …

RDkitでSMILESからSDFの作成

SDF形式にすることで、立体構造を要求する処理が可能になるのはもちろんですが、目的変数と化合物構造を紐づけておくことができるので間違いが起こりにくいという利点があります。 サンプルデータ 例のごとくdeepchem付属のdelaney水溶解度データセットを使…

RDkitでModuleNotFoundError

症状 久々にrdkitをインストールしようとしたらModuleNotFoundError In [1]: import rdkit --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython-input-1-6b72bd8913ab> in <module>() ----> 1 import rd</module></ipython-input-1-6b72bd8913ab>…