Mittwoch, 12. Juni 2013

AutoDock & MGLTools: Workshop on Computer Aided Drug Design

Zwei Entwickler der AutoDock suite und der MGLTools, Stefano Forli und  Michel Sanner, kommen im September zu uns nach Europa und präsentieren computer aided drug discovery (CADD) im Rahmen eines einwöchigen Workshops.  Viel mehr "tangible computational biology" geht nicht.

Dear all,

We cordially invite you to the workshop

"AutoDock and MGLTools: computer-aided drug discovery "
September 16 - 20, 2013 at the University of Lübeck, Germany.

We are happy to announce that Stefano Forli and Michel Sanner, both lead developers at the Molecular Graphics Lab at The Scripps Institute, La Jolla, California, offer a week of their time to present overviews and interna of AutoDock and the MGLtools for in silico drug screening and protein visualisation. They will introduce participants into their workflows comprising the whole process
  • from ligand preparation
  • via job control for high throughput docking
  • to result evaluation.
The workshop offers lectures and exercises to support the participants in
gaining experience and improving their skills in the above described
tasks. Participants are encouraged to bring their own data for a
fruitful exchange among themselves and the developers.

For more details please visit http://www.gradschool.uni-luebeck.de/autodock.
Pleased forward this workshop announcement to potentially interested colleagues. Hoping to welcome many of you in September in Lübeck,

with kind regards,

Steffen Möller, Department of Dermatology, University of Lübeck
Katja Dau, Graduate Scool for Computing in Medicine and Life Sciences, University of Lübeck

Samstag, 12. Mai 2012

BitCoins minen ... ein Sprungbrett für FPGA?

Wie praktisch sind nun denn wohl FPGAs? Nimmt man sie sich geschwind zur Hand, wenn man etwas größeres mit FPGA Unterstützung zu rechnen hat? Angeschlossen, wenn nicht im Rechner breits verbaut, sind sie schnell per USB Kabel. Spannend ist der Vergleich mit handelsüblichen GPUs und der CPU, wie sie bereits in regulaeren Rechnern vorliegen, also eher nichts zusätzlich kosten. Seit bereits einem halben Jahr habe ich die ZTEX 1.15 mit einem Xilinx LX75 - und noch nichts damit gemacht ausser einem "Hello World", dieses aber immerhin von A bis Z.  Nun gibt es aber BitCoins als Zahlungsmittel und FPGAs sind gut darin, diese zu "minen".  Gemessen werden getestete Hashes pro Sekunde. Alles ist Open Source und sollte auf allen Platformen funktionieren.

Auf einem 1.8GHz dual Celeron bekam ich 0.5Mhashes/s. Ein 3.2GHz i5 core kommt auf 2.5 Mh/s. Eine 650 MHz AMD/ATI HD5670  Grafikkarte schafft 64Mh/s. Der FPGA mit 184MHz bringt 92 Mh/s. Nun ist das nicht die bestmögliche Grafikkarte, aber es ist auch bei weitem nicht der breiteste FPGA. Jedenfalls macht der anders als die Grafikkarte keinen Krach da passiv gekühlt und verbraucht deutlich weniger Energie. Steckt man ihn sich schnell an? Ich denke schon. Es werden auch FPGA-Karten mit mehreren FPGA darauf angeboten, und zudem kann man diese Karten auch clustern. Hier sollte sich doch ein Open Source Markt entwickeln können - wenigstens für die Bioinformatik.
Das BitCoin Mining ist nicht sonderlich attraktiv anzuschauen. Man sieht links die Grafikkarte mit Phoenix 2.0. Rechts ist der FPGA mit ZTEX's BTCMiner. Abundan kommt ein Treffer und der wird, so man nicht alleine arbeiten möchte, an einen Server geschickt - ganz in Analogie zu BOINC. Es gibt eine ganze Reihe solcher "pools". Diese organisieren eine beeindruckende Rechenleistung von >3000000 Mh/s (3000 Gh/s), also etwa 30000 FPGA der Art wie ich einen habe oder eine Million guter CPU cores.


Der screenshot oben ist nun schon wieder etwas überholt. Ich bin nun drei Stunden dabei und damit wird sich mein Ausflug zum Bitcoin Mining wohl auch beenden. Immerhin habe ich inzwischen etwa 0,02 Euro eingespielt. Über den Tag hinweg wären das vielleicht 0,16, in der Woche ein Euro. 

Wenn über USB angeschlossen, sind FPGA wohl auch über virtuelle Maschinen anzusprechen. Wir sollten also bald vermehrt FPGA in Clouds sehen. Probiert habe ich das aber noch nicht. Reizen würde mich auch eine Integration mit BOINC. Ähnlich den GPUs benötigt man selber die hohe Rechenleistung nun einmal nur für kurze Zeit, die andere Zeit stünde die Maschine zur Verfügung. Wenn man sieht, wieviel Rechenleistung da hinter den paar Euro herjagt, wäre es vermutlich geschickter, wenn BOINC sich organisieren würde, um Bitcoins für getane Arbeit an ihren Projekten direkt zur Verfügung zu stellen.

Ich danke den BitCoinern, da sie FPGA plötzlich für die Masse so viel interessanter machen. So wie GPUs die Spiele brauchten, habe ich nichts dagegen, wenn sich FPGAs über BitCoins in die Herzen spielen. Mein nächster Bericht zu FPGA ist aber hoffentlich irgendwie bioinformatisch.

Montag, 23. April 2012

BitCoins und FPGA zur technischen Vorbereitung auf die Bioinformatik

Nach vielem Lesen darüber wollte ich es diese Woche nun auch mal probieren: 1KJqLGAEaVMLWNVEq3McPv4KGqSwYLpxEP ist nun meine BitCoin Adresse für diesen Blog. Probiert es doch mal aus, ich freue mich über jeden μBitcoin :o)  Mein Einstieg war bei BitCoin.de.

Ein BitCoin ist in etwa soviel wert wie es kostet, ihn zu berechnen und damit der erste zu sein.  Das sind derzeit etwa 4 Euro. Gehandelt wird er bei Börsen wie eben BitCoin.de oder man berechnet ihn eben selber. Wer besonders effiziente Maschinen hat, hat einen Vorteil. Und die in einem früheren Posting bereits erwähnte Firma ZTEX aus Dresden bietet bereits einen FPGA-BitMiner an. Wer sich also ein Gerät besorgen möchte, das sich vermutlich viermal schneller als Solarzellen amortisiert, der greife zu und lerne dabei ... und nutze sein so gemehrtes technisches Wissen dann für die bioinformatische Forschung, bitte.




Samstag, 21. April 2012

Debian+Science+PR

Debian Science und Public Relations ... "we suck at PR". Da sind sich alle Mitwirkenden bei Debian Science oder Debian Med recht einig. Naja, aber wer will schon etwa auf Kongressen an einen Debian Stand stellen statt den Präsentationen zuzuhören. Schliesslich kostet das auch alles Zeit und  Geld. Beides haben wir dafür eher nicht übrig. Selbst Open Access Veröffentlichungen kosten. Wer Debian Geld gibt (Spenden hierhin oder rechts an der Seite via Amazon das eine oder andere bitte kaufen), der gibt dies vermutlich eher für die Verbesserung von Debian, nicht für dessen Verbreitung, frei nach: wer Debian finden möchte, der findet Debian. Und wer mitmachen möchte, der kann ja mitmachen (Debian Diversity Statement).

In meiner persönlichen Wahrnehmung ist das alles nicht so tragisch. Für PR haben wir Ubuntu. Und in unseren Fachgebieten kennen wir uns alle mehr oder minder oder wenigstens über eine Ecke. In die Welt getragen gehört dort, wie offen wir auch für speziellere Software sind, also die jeweiligen Institute von der Infrastruktur Debians direkt profitieren können und fachliche Kooperationen sich so leichter umsetzen lassen. Wenn sich größere Institute öffentlich zu Debian bekennen, wie etwa gerade das European Synchrotoron, so ist das sehr erfreulich, denn bestimmt stärkt dies die Gemeinschaft. Aber gerade bei Debian Med liegt der Gewinn wohl eher bei den vielen kleineren zerstreuten Gruppen, die durch die direkte Verfügbarkeit von Programmcode und den ausführbaren Dateien viel an Kraft durch Debian/Ubuntu/Mint/... gewinnen. Sollte man die hier nun alle erwähnen? Für wen?

Über die Stärkung des Miteinanders von Workflow engines wie Taverna, Template "Rezepten" in myExperiment.org und Linux Distributionen wie eben Debian versuche ich seit einer Weile, dem Miteinander der vielen kleinen Expertengruppen so etwas wie einen ausführbaren Rahmen zu geben. Bislang klappt das noch nicht so wirklich. Mal sehen.

Samstag, 25. Februar 2012

EURO-Codefest 2012 in Bergamo

Die Bioinformatics Open Source Conference (BOSC) ist dieses Jahr in Kalifornien. Das ist ein wenig weit weg, für viele zu weit. In den vergangenen Jahren gab es zur BOSC stets ein pre-meeting, bei dem es (ganz ohne Vorträge) nur um ein konstruktives Miteinander der vielen Entwickler geht. Man kennt sich, oder die jeweilige software, lernt sich kennen, denkt gemeinsam weiter.

Nun hatte ein niederländisch-italienische Trupp die Idee, doch so ein bioinformatisches Codefest eine Woche später auch in Europa stattfinden zu lassen. Gewählt wurde die direkte Umgebung von Bergamo/Mailand, Lodi, am 19. und 20. Juli. Mehr hier.

Es gibt eine gewisse Überlappung hinsichtlich der voraussichtlichen Teilnehmer zum Debian Med sprint. Und das ist gut so.

Mittwoch, 30. November 2011

Debian Med und Bio-Linux veranstalten einen gemeinsamen "Sprint" fuer ein gemeinsames Lösen von bekannten Problemen und dem Beschreiben von neuen. Unsere Veranstaltungsseite ist http://wiki.debian.org/DebianMed/Meeting/Southport2012. Wir sind schon mehr oder minder "voll" wie in "der Frühstücksraum des Hotels fasst nicht mehr Leute". Aber 2-3 können wohl noch kommen.

Dieses Jahr findet insbesondere auch ein ganztägiges Tutorial durch die Firma SciEngines zum FPGA computing statt. Das wird richtig spannend, denke ich. Die Kunst wird sein, die Community von dem Gewinn durch FPGA acceleration zu überzeugen. Wenn alles gut läuft, so kommt damit die dann auf bislang ungedachte Ideen und die Technologie erlebt einen ähnlichen Höhenflug wie aktuell die OpenCL oder CUDA GPU Programmierung. Nur noch schneller soll es bitte sein. Und ganz sicher wird es deutlichst energieeffizienter. Ich bin mir nicht so ganz supersicher, dass programmierte hardware more tangible ist als Software - vielleicht ein wenig. Ich freue mich jedenfalls - auf das Tutorial und einen allgemeinen Trend zur Beschleunigung über die CPU-eigene hinaus.

Ansonsten wird der Sprint einige Leute zusammenführen, die bislang noch nicht so lang so eng zusammensaßen. Wir haben insbesondere eine recht dicht gepackte Skill-Liste zusammen von der Sequenz-Bioinformatik in Reinstform über alle Graustufen bis hin zur Struktur-Bioinformatik. Wir haben viel davon nun bereits in Debian - so etwa Ensembl, Jalview und die tools von PredictProtein. STRAP und genometools.org schaffen wir vielleicht nicht rechtzeitig bis zum Sprint, aber wohl fast. Auch in Richtung Systembiologie wird einiges geschenen. Aber ein erreichbareres Ziel ist vielleicht zunaechst eine Integration dieser Neuankömmlinge mit dem Workflow Tool Taverna.

Mein besonderer Dank gilt denjenigen, die die Amazon links nutzten. Das vergangene Jahr brachte insgesamt 29 Euro - und davon sind 6,90 von unserem Hundefutter und irgendwer hat offenbar allein im September richtig viel über den Link bestellt. Ich werde diesen Betrag zur Unterstützung des Sprints verwenden. An Gelegenheit dazu wird es nicht fehlen.

Samstag, 3. September 2011

Debian führt seit einigen Jahren das Paket AutoDock. Zur Verfollständigung des BOINC Server Projektes schaute ich nun nochmal vermehrt nach gescheitem Input für AutoDock und wurde fündig bei einer Aktion des WorldCommunityGrid Projektes FightAids@Home, das eben auch mit diesem Werkzeug arbeitet. Dort hat man verständliche Teilmengen der ZINC Datenbank in vorprozssierter Form abgelegt. So hat man etwa auf einen Schlag Zugriff auf alle von der FDA bereits zugelassenen Wirkstoffe.

Für diesen Datensatz ist es nicht gar so nötig, doch hat Debian seit ein paar wenigen Wochen das Werkzeug getData. Und na klar wollte ich das hierfür ausprobieren. Ich bereite also ein Ergänzungspaket für AutoDock und AutoGrid vor, das insbesondere nun eine Abhängigkeit von getData hat und eine Entsprechende Erweiterung des Wissens von getData in /etc/getData.conf.d/autodock-zinc.getData steckt.

Man kann sich nun das Anschauen

$ getData --list | grep zinc
zinc_natural_products
zinc.pdbqt.asinex ZINC - PDBQT formatted – asinex
zinc.pdbqt.chembridge_buildingblocks_pdbqt_1000split ZINC - PDBQT formatted – chembridge_buildingblocks_pdbqt_1000split
zinc.pdbqt.drugbank_nutraceutics ZINC - PDBQT formatted – drugbank_nutraceutics
zinc.pdbqt.drugbank_smallmol ZINC - PDBQT formatted – drugbank_smallmol
zinc.pdbqt.fda_approved ZINC - PDBQT formatted – fda_approved
zinc.pdbqt.human_metabolome_pdbqt_1000split ZINC - PDBQT formatted – human_metabolome_pdbqt_1000split
zinc.pdbqt.otava ZINC - PDBQT formatted – otava
zinc.pdbqt.zinc_natural_products ZINC - PDBQT formatted – zinc_natural_products

und eben auch per Knopfdruck installieren. Und ganz Nebenher wird nun das AutoDock binary auch noch schneller, da g++ 4.6 inzwischen angekommen ist und damit auch die link time optimisation.

Es gibt noch sehr viele freie Programme die das DebiChem team oder (na klar) auch Debian Med gern für die weitere Bearbeitung der Rezeptoren oder dieser Liganden in Debian sehen würde. Wenn jemand die freie Kapazität hätte, sich hier als Maintainer zu betätigen, so wärte das sehr hilfreich. Ziel ist die weitere Komplettierung von Workflows in der computational biology. Bitte melden. Auch interessieren mich Ideen für den Einsatz von getData und dessen Weiterentwicklung.