Samstag, 3. September 2011

Debian führt seit einigen Jahren das Paket AutoDock. Zur Verfollständigung des BOINC Server Projektes schaute ich nun nochmal vermehrt nach gescheitem Input für AutoDock und wurde fündig bei einer Aktion des WorldCommunityGrid Projektes FightAids@Home, das eben auch mit diesem Werkzeug arbeitet. Dort hat man verständliche Teilmengen der ZINC Datenbank in vorprozssierter Form abgelegt. So hat man etwa auf einen Schlag Zugriff auf alle von der FDA bereits zugelassenen Wirkstoffe.

Für diesen Datensatz ist es nicht gar so nötig, doch hat Debian seit ein paar wenigen Wochen das Werkzeug getData. Und na klar wollte ich das hierfür ausprobieren. Ich bereite also ein Ergänzungspaket für AutoDock und AutoGrid vor, das insbesondere nun eine Abhängigkeit von getData hat und eine Entsprechende Erweiterung des Wissens von getData in /etc/getData.conf.d/autodock-zinc.getData steckt.

Man kann sich nun das Anschauen

$ getData --list | grep zinc
zinc_natural_products
zinc.pdbqt.asinex ZINC - PDBQT formatted – asinex
zinc.pdbqt.chembridge_buildingblocks_pdbqt_1000split ZINC - PDBQT formatted – chembridge_buildingblocks_pdbqt_1000split
zinc.pdbqt.drugbank_nutraceutics ZINC - PDBQT formatted – drugbank_nutraceutics
zinc.pdbqt.drugbank_smallmol ZINC - PDBQT formatted – drugbank_smallmol
zinc.pdbqt.fda_approved ZINC - PDBQT formatted – fda_approved
zinc.pdbqt.human_metabolome_pdbqt_1000split ZINC - PDBQT formatted – human_metabolome_pdbqt_1000split
zinc.pdbqt.otava ZINC - PDBQT formatted – otava
zinc.pdbqt.zinc_natural_products ZINC - PDBQT formatted – zinc_natural_products

und eben auch per Knopfdruck installieren. Und ganz Nebenher wird nun das AutoDock binary auch noch schneller, da g++ 4.6 inzwischen angekommen ist und damit auch die link time optimisation.

Es gibt noch sehr viele freie Programme die das DebiChem team oder (na klar) auch Debian Med gern für die weitere Bearbeitung der Rezeptoren oder dieser Liganden in Debian sehen würde. Wenn jemand die freie Kapazität hätte, sich hier als Maintainer zu betätigen, so wärte das sehr hilfreich. Ziel ist die weitere Komplettierung von Workflows in der computational biology. Bitte melden. Auch interessieren mich Ideen für den Einsatz von getData und dessen Weiterentwicklung.