どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

python

Pythonの分散並列処理ライブラリRayの使い方

いままでありがとうmultiprocessing。そしてこんにちはRay Rayとは 基本的な使い方 並列化していないコード Rayによる並列化コード 待ち合わせ処理: ray.get 逐次処理: ray.wait クラス単位でのサブプロセス化 リソースの設定: ray.init クラスターでの分…

Dataclassをjson形式でシリアライズ

Data ClassesはPython3.7からの新機能です。その名の通りデータを保持するためのクラスを簡潔に記述することができます。 Dataclassはdataclasses_jsonパッケージを使うことによりお手軽にjson形式へ変換できます。 github.com json形式でシリアライズできる…

Python初心者講習のためのJupyterHub

JupyterHubを利用して管理者が用意したPythonチュートリアル用 jupyter notebookをユーザーがブラウザからすぐに実行できる環境を構築します。 JupyterHubによる、不特定多数のユーザーがブラウザからアクセスするだけでPythonを実行できる環境の提供 Docker…

kerasで化合物SeqToSeq Autoencoder

化合物VAEを作ろうとしたのですが、VAEは思ったよりややこしかったのでとりあえず化合物AEをしました。 はじめに 化合物構造(smiles)を入力し、次元圧縮した後に化合物構造(smiles)を復元するautoencoderモデルを作成します。 VAEではないので化合物生成に…

RDkitで分子骨格に基づく化合物セットのクラスタリング

多様性を保ちながらできるだけコンパクトに あなたは大規模な化合物データセットからin silicoスクリーニングを行い、有望な5000化合物のリストを作成しました。 しかし、この化合物リストをアッセイ担当の研究者に渡すと 「5000化合物もアッセイできるわけ…

Object detection APIで自作データセットを訓練する②

[前回] horomary.hatenablog.com label_map.pbtxtの作成 label_map.pbtxtはラベル名とidを対応づけるファイルです。 TFrecordに格納したimage/object/class/labelとimage/object/class/textに対応するようにしましょう。 # label_map.pbtxt 記入例 item { id…

Object detection APIで自作データセットを訓練する①

はじめに 前回やった”TensorFlowのObject detection APIで東方キャラの顔認識”の手順を記録しておきます。 horomary.hatenablog.com ※基本的に下記リンクで公開されている手順を参考にしています。ありがとうすごい人。 github.com Object detection APIとは…

PILでPNG画像をJPEG形式で保存したらなんか黒くなった

やりたいこと 以下のようなpng画像をjpeg形式にして保存しなおす。 エラー内容 from PIL import Image image = Image.open(PNG_FILE) image.save("out.jpg","JPEG",quality=95) # 出力 OSError: cannot write mode RGBA as JPEG PILでpng画像を読み込み、そ…

DeepChemによる化合物フィンガープリント-水溶解性回帰モデルをLIMEで解析

LIMEというモデル解釈ツールを使用してDeepChemで作成した回帰モデルの解析を行います。 本稿はDeepChemのモデル解釈チュートリアルを参考に作成しています。 ※化合物ではなく一般的なテーブルデータから作成されたモデルにLIMEを適用する例は下記を参照くだ…

Deepchem④(XGBで回帰)

kaggleで大人気のxgboostもDeepchemで使用することができます。 XGBoost Documentation — xgboost 0.80 documentation 準備 例によってdelaney水溶解度データセットを読み込みます。featurizerは適当にRDKitDescriptors()にしました。 import deepchem as dc…

Deepchm③(グラフ畳み込みで回帰)

分子グラフの畳み込みモデルでdelaney-水溶解度データセットの回帰を行います。 csvデータのロード 例のごとくdelaney水溶解度データセットをロードします。 MPNNモデルやCoulomb matrix featurizerなどを使いたい場合は立体構造が必要ですが、ConvMolFeatur…

RDkitで分子フィンガープリントの生成

RDkitで各種の分子フィンガープリントの生成を行います。 マルチSDF読み込み delaney水溶解度データセットから作成したマルチSDFを読み込みます。 horomary.hatenablog.com from rdkit import Chem mols = Chem.SDMolSupplier('delaney_multi.sdf') for mol …

RDkitでSMILESからSDFの作成

SDF形式にすることで、立体構造を要求する処理が可能になるのはもちろんですが、目的変数と化合物構造を紐づけておくことができるので間違いが起こりにくいという利点があります。 サンプルデータ 例のごとくdeepchem付属のdelaney水溶解度データセットを使…

DeepChem②(sklearnモデルで回帰)

DeepChemのチュートリアルを参考に、化合物の水溶解度データセット(delaneyデータセット)を用いて単目的回帰します。 Modeling Solubility 化合物フィンガープリントによる単目的回帰 まずはオーソドックスな化合物フィンガープリントによって単目的回帰を行…

DeepChem① (csvデータ読み込み)

Pythonの化合物グラフ畳み込みのライブラリであるDeepChemを試します。 インストール GPU版をインストール ~$ conda create -n deepchem-gpu ~$ conda install jupyter ~$ conda install -c deepchem -c rdkit -c conda-forge -c omnia deepchem-gpu=2.1.0 …

RDkitでModuleNotFoundError

症状 久々にrdkitをインストールしようとしたらModuleNotFoundError In [1]: import rdkit --------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) <ipython-input-1-6b72bd8913ab> in <module>() ----> 1 import rd</module></ipython-input-1-6b72bd8913ab>…