どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

cheminformatics

kerasで化合物SeqToSeq Autoencoder

化合物VAEを作ろうとしたのですが、VAEは思ったよりややこしかったのでとりあえず化合物AEをしました。 はじめに 化合物構造(smiles)を入力し、次元圧縮した後に化合物構造(smiles)を復元するautoencoderモデルを作成します。 VAEではないので化合物生成に…

RDkitで分子骨格に基づく化合物セットのクラスタリング

多様性を保ちながらできるだけコンパクトに あなたは大規模な化合物データセットからin silicoスクリーニングを行い、有望な5000化合物のリストを作成しました。 しかし、この化合物リストをアッセイ担当の研究者に渡すと 「5000化合物もアッセイできるわけ…

DeepChemによる化合物フィンガープリント-水溶解性回帰モデルをLIMEで解析

LIMEというモデル解釈ツールを使用してDeepChemで作成した回帰モデルの解析を行います。 本稿はDeepChemのモデル解釈チュートリアルを参考に作成しています。 ※化合物ではなく一般的なテーブルデータから作成されたモデルにLIMEを適用する例は下記を参照くだ…

Deepchem④(XGBで回帰)

kaggleで大人気のxgboostもDeepchemで使用することができます。 XGBoost Documentation — xgboost 0.80 documentation 準備 例によってdelaney水溶解度データセットを読み込みます。featurizerは適当にRDKitDescriptors()にしました。 import deepchem as dc…

Deepchm③(グラフ畳み込みで回帰)

分子グラフの畳み込みモデルでdelaney-水溶解度データセットの回帰を行います。 csvデータのロード 例のごとくdelaney水溶解度データセットをロードします。 MPNNモデルやCoulomb matrix featurizerなどを使いたい場合は立体構造が必要ですが、ConvMolFeatur…

RDkitで分子フィンガープリントの生成

RDkitで各種の分子フィンガープリントの生成を行います。 マルチSDF読み込み delaney水溶解度データセットから作成したマルチSDFを読み込みます。 horomary.hatenablog.com from rdkit import Chem mols = Chem.SDMolSupplier('delaney_multi.sdf') for mol …

RDkitでSMILESからSDFの作成

SDF形式にすることで、立体構造を要求する処理が可能になるのはもちろんですが、目的変数と化合物構造を紐づけておくことができるので間違いが起こりにくいという利点があります。 サンプルデータ 例のごとくdeepchem付属のdelaney水溶解度データセットを使…

DeepChem②(sklearnモデルで回帰)

DeepChemのチュートリアルを参考に、化合物の水溶解度データセット(delaneyデータセット)を用いて単目的回帰します。 Modeling Solubility 化合物フィンガープリントによる単目的回帰 まずはオーソドックスな化合物フィンガープリントによって単目的回帰を行…

DeepChem① (csvデータ読み込み)

Pythonの化合物グラフ畳み込みのライブラリであるDeepChemを試します。 インストール GPU版をインストール ~$ conda create -n deepchem-gpu ~$ conda install jupyter ~$ conda install -c deepchem -c rdkit -c conda-forge -c omnia deepchem-gpu=2.1.0 …

RDkitでModuleNotFoundError

症状 久々にrdkitをインストールしようとしたらModuleNotFoundError In [1]: import rdkit --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython-input-1-6b72bd8913ab> in <module>() ----> 1 import rd</module></ipython-input-1-6b72bd8913ab>…