Samstag, 12. Mai 2012
BitCoins minen ... ein Sprungbrett für FPGA?
Auf einem 1.8GHz dual Celeron bekam ich 0.5Mhashes/s. Ein 3.2GHz i5 core kommt auf 2.5 Mh/s. Eine 650 MHz AMD/ATI HD5670 Grafikkarte schafft 64Mh/s. Der FPGA mit 184MHz bringt 92 Mh/s. Nun ist das nicht die bestmögliche Grafikkarte, aber es ist auch bei weitem nicht der breiteste FPGA. Jedenfalls macht der anders als die Grafikkarte keinen Krach da passiv gekühlt und verbraucht deutlich weniger Energie. Steckt man ihn sich schnell an? Ich denke schon. Es werden auch FPGA-Karten mit mehreren FPGA darauf angeboten, und zudem kann man diese Karten auch clustern. Hier sollte sich doch ein Open Source Markt entwickeln können - wenigstens für die Bioinformatik.
Das BitCoin Mining ist nicht sonderlich attraktiv anzuschauen. Man sieht links die Grafikkarte mit Phoenix 2.0. Rechts ist der FPGA mit ZTEX's BTCMiner. Abundan kommt ein Treffer und der wird, so man nicht alleine arbeiten möchte, an einen Server geschickt - ganz in Analogie zu BOINC. Es gibt eine ganze Reihe solcher "pools". Diese organisieren eine beeindruckende Rechenleistung von >3000000 Mh/s (3000 Gh/s), also etwa 30000 FPGA der Art wie ich einen habe oder eine Million guter CPU cores.
Der screenshot oben ist nun schon wieder etwas überholt. Ich bin nun drei Stunden dabei und damit wird sich mein Ausflug zum Bitcoin Mining wohl auch beenden. Immerhin habe ich inzwischen etwa 0,02 Euro eingespielt. Über den Tag hinweg wären das vielleicht 0,16, in der Woche ein Euro.
Wenn über USB angeschlossen, sind FPGA wohl auch über virtuelle Maschinen anzusprechen. Wir sollten also bald vermehrt FPGA in Clouds sehen. Probiert habe ich das aber noch nicht. Reizen würde mich auch eine Integration mit BOINC. Ähnlich den GPUs benötigt man selber die hohe Rechenleistung nun einmal nur für kurze Zeit, die andere Zeit stünde die Maschine zur Verfügung. Wenn man sieht, wieviel Rechenleistung da hinter den paar Euro herjagt, wäre es vermutlich geschickter, wenn BOINC sich organisieren würde, um Bitcoins für getane Arbeit an ihren Projekten direkt zur Verfügung zu stellen.
Ich danke den BitCoinern, da sie FPGA plötzlich für die Masse so viel interessanter machen. So wie GPUs die Spiele brauchten, habe ich nichts dagegen, wenn sich FPGAs über BitCoins in die Herzen spielen. Mein nächster Bericht zu FPGA ist aber hoffentlich irgendwie bioinformatisch.
Montag, 23. April 2012
BitCoins und FPGA zur technischen Vorbereitung auf die Bioinformatik
Ein BitCoin ist in etwa soviel wert wie es kostet, ihn zu berechnen und damit der erste zu sein. Das sind derzeit etwa 4 Euro. Gehandelt wird er bei Börsen wie eben BitCoin.de oder man berechnet ihn eben selber. Wer besonders effiziente Maschinen hat, hat einen Vorteil. Und die in einem früheren Posting bereits erwähnte Firma ZTEX aus Dresden bietet bereits einen FPGA-BitMiner an. Wer sich also ein Gerät besorgen möchte, das sich vermutlich viermal schneller als Solarzellen amortisiert, der greife zu und lerne dabei ... und nutze sein so gemehrtes technisches Wissen dann für die bioinformatische Forschung, bitte.
Samstag, 21. April 2012
Debian+Science+PR
In meiner persönlichen Wahrnehmung ist das alles nicht so tragisch. Für PR haben wir Ubuntu. Und in unseren Fachgebieten kennen wir uns alle mehr oder minder oder wenigstens über eine Ecke. In die Welt getragen gehört dort, wie offen wir auch für speziellere Software sind, also die jeweiligen Institute von der Infrastruktur Debians direkt profitieren können und fachliche Kooperationen sich so leichter umsetzen lassen. Wenn sich größere Institute öffentlich zu Debian bekennen, wie etwa gerade das European Synchrotoron, so ist das sehr erfreulich, denn bestimmt stärkt dies die Gemeinschaft. Aber gerade bei Debian Med liegt der Gewinn wohl eher bei den vielen kleineren zerstreuten Gruppen, die durch die direkte Verfügbarkeit von Programmcode und den ausführbaren Dateien viel an Kraft durch Debian/Ubuntu/Mint/... gewinnen. Sollte man die hier nun alle erwähnen? Für wen?
Über die Stärkung des Miteinanders von Workflow engines wie Taverna, Template "Rezepten" in myExperiment.org und Linux Distributionen wie eben Debian versuche ich seit einer Weile, dem Miteinander der vielen kleinen Expertengruppen so etwas wie einen ausführbaren Rahmen zu geben. Bislang klappt das noch nicht so wirklich. Mal sehen.
Samstag, 25. Februar 2012
EURO-Codefest 2012 in Bergamo
Die Bioinformatics Open Source Conference (BOSC) ist dieses Jahr in Kalifornien. Das ist ein wenig weit weg, für viele zu weit. In den vergangenen Jahren gab es zur BOSC stets ein pre-meeting, bei dem es (ganz ohne Vorträge) nur um ein konstruktives Miteinander der vielen Entwickler geht. Man kennt sich, oder die jeweilige software, lernt sich kennen, denkt gemeinsam weiter.
Nun hatte ein niederländisch-italienische Trupp die Idee, doch so ein bioinformatisches Codefest eine Woche später auch in Europa stattfinden zu lassen. Gewählt wurde die direkte Umgebung von Bergamo/Mailand, Lodi, am 19. und 20. Juli. Mehr hier.
Es gibt eine gewisse Überlappung hinsichtlich der voraussichtlichen Teilnehmer zum Debian Med sprint. Und das ist gut so.
Mittwoch, 30. November 2011
Debian Med und Bio-Linux veranstalten einen gemeinsamen "Sprint" fuer ein gemeinsames Lösen von bekannten Problemen und dem Beschreiben von neuen. Unsere Veranstaltungsseite ist http://wiki.debian.org/DebianMed/Meeting/Southport2012. Wir sind schon mehr oder minder "voll" wie in "der Frühstücksraum des Hotels fasst nicht mehr Leute". Aber 2-3 können wohl noch kommen.
Dieses Jahr findet insbesondere auch ein ganztägiges Tutorial durch die Firma SciEngines zum FPGA computing statt. Das wird richtig spannend, denke ich. Die Kunst wird sein, die Community von dem Gewinn durch FPGA acceleration zu überzeugen. Wenn alles gut läuft, so kommt damit die dann auf bislang ungedachte Ideen und die Technologie erlebt einen ähnlichen Höhenflug wie aktuell die OpenCL oder CUDA GPU Programmierung. Nur noch schneller soll es bitte sein. Und ganz sicher wird es deutlichst energieeffizienter. Ich bin mir nicht so ganz supersicher, dass programmierte hardware more tangible ist als Software - vielleicht ein wenig. Ich freue mich jedenfalls - auf das Tutorial und einen allgemeinen Trend zur Beschleunigung über die CPU-eigene hinaus.
Ansonsten wird der Sprint einige Leute zusammenführen, die bislang noch nicht so lang so eng zusammensaßen. Wir haben insbesondere eine recht dicht gepackte Skill-Liste zusammen von der Sequenz-Bioinformatik in Reinstform über alle Graustufen bis hin zur Struktur-Bioinformatik. Wir haben viel davon nun bereits in Debian - so etwa Ensembl, Jalview und die tools von PredictProtein. STRAP und genometools.org schaffen wir vielleicht nicht rechtzeitig bis zum Sprint, aber wohl fast. Auch in Richtung Systembiologie wird einiges geschenen. Aber ein erreichbareres Ziel ist vielleicht zunaechst eine Integration dieser Neuankömmlinge mit dem Workflow Tool Taverna.
Mein besonderer Dank gilt denjenigen, die die Amazon links nutzten. Das vergangene Jahr brachte insgesamt 29 Euro - und davon sind 6,90 von unserem Hundefutter und irgendwer hat offenbar allein im September richtig viel über den Link bestellt. Ich werde diesen Betrag zur Unterstützung des Sprints verwenden. An Gelegenheit dazu wird es nicht fehlen.
Samstag, 3. September 2011
Für diesen Datensatz ist es nicht gar so nötig, doch hat Debian seit ein paar wenigen Wochen das Werkzeug getData. Und na klar wollte ich das hierfür ausprobieren. Ich bereite also ein Ergänzungspaket für AutoDock und AutoGrid vor, das insbesondere nun eine Abhängigkeit von getData hat und eine Entsprechende Erweiterung des Wissens von getData in /etc/getData.conf.d/autodock-zinc.getData steckt.
Man kann sich nun das Anschauen
$ getData --list | grep zinc
zinc_natural_products
zinc.pdbqt.asinex ZINC - PDBQT formatted – asinex
zinc.pdbqt.chembridge_buildingblocks_pdbqt_1000split ZINC - PDBQT formatted – chembridge_buildingblocks_pdbqt_1000split
zinc.pdbqt.drugbank_nutraceutics ZINC - PDBQT formatted – drugbank_nutraceutics
zinc.pdbqt.drugbank_smallmol ZINC - PDBQT formatted – drugbank_smallmol
zinc.pdbqt.fda_approved ZINC - PDBQT formatted – fda_approved
zinc.pdbqt.human_metabolome_pdbqt_1000split ZINC - PDBQT formatted – human_metabolome_pdbqt_1000split
zinc.pdbqt.otava ZINC - PDBQT formatted – otava
zinc.pdbqt.zinc_natural_products ZINC - PDBQT formatted – zinc_natural_products
und eben auch per Knopfdruck installieren. Und ganz Nebenher wird nun das AutoDock binary auch noch schneller, da g++ 4.6 inzwischen angekommen ist und damit auch die link time optimisation.
Es gibt noch sehr viele freie Programme die das DebiChem team oder (na klar) auch Debian Med gern für die weitere Bearbeitung der Rezeptoren oder dieser Liganden in Debian sehen würde. Wenn jemand die freie Kapazität hätte, sich hier als Maintainer zu betätigen, so wärte das sehr hilfreich. Ziel ist die weitere Komplettierung von Workflows in der computational biology. Bitte melden. Auch interessieren mich Ideen für den Einsatz von getData und dessen Weiterentwicklung.
Samstag, 27. August 2011
BOINC+AutoDock+Debian ... Walk-Through für eigene BOINC Projekte
Für Rechencluster, die eine übersichtliche Menge von sich regelmäßig verbesserten Anwendungen nutzen, ist BOINC einer super Alternative sogar zu regulären batch systems wie Torque oder die Sun Grid Engine. Schliesslich muss man sich nach einer initialen Installation von BOINC um nichts mehr kümmern. Updates und Architektur-Abhängigkeiten lösen Server und Client alleine. Und dies macht BOINC auch für diejenigen interessant, die gar keine eigene Recheninfrastrukur haben.
Auf wiki.debian.org/BOINC/ServerGuide gibt es nun eine recht komplette Einführung in die Nutzung von BOINC mit sogenannten legacy Anwendungen. Gemeint sind damit solche, die von dem BOINC API nichts wissen. Man benötigt hierfür einen Wrapper. Neben den Beispielprogrammen haben wir (mein 2011 Google Summer of Code Student Dhananjay und ich) insbesondere das molekulare Docking als biochemische Anwendung im Auge gehabt. Wie verständlich ist das ganze? Es sollte von einem versierten Schüler oder einem Informatik Studi in den ersten Semestern alles hinzubekommen sein. Kommentare bitte hierher, direkt an die Wiki Seite oder an mich. Danke.

