Jens A. Koch

Wolfram Alpha – “particularity”


Es ist der 16.05.2009, 2Uhr nachts. Ich begebe mich auf die Website http://www.wolframalpha.com/ um zu sehen, ob die neue Suchmaschine “Wolfram Alpha” schon nutzbar ist. Fehlanzeige.

Laut Stephen Wolfram, dem Vater des Projekts, wird das Wochenende sehr experimentell. Er ist sich nicht sicher, ob man die Suche überhaupt live bekommt, da ein solches Projekt noch nie durchgeführt wurde. Aha.
Wie recht er hat.
Ich schaue mir ein kurzes einleitendes Video an.

Dann wechsle ich auf die Seite http://www.justin.tv/wolframalpha. Dort überträgt “Justin.tv” den Inbetriebnahmeversuch live. Das sogenannte “Live Broadcasting” ist heutzutage ein wichtiges Marketingsinstrument. Für 30 Sekunden sehe ich den Kontrollraum, dann bricht die Leitung zusammen. Justin.tv kommt mit dem Upload nicht klar.

Der Kontrollraum sieht etwas nach dem NASA Space-Mission Control Room aus. Links im Kontrollraum sitzt Chef Stephen Wolfram persönlich, hinter ihm ein Wolfram Alpha Schriftzug. Etwa 20 Menschen sitzen in der Mitte des Raums an ihren Laptops. Etwa 5-6 große TFT’s befinden sich vor ihnen. Die rechte Wand des Raums wird für eine Beamer-Projektion verwendet. Im Livechat zum Videostream spricht man inzwischen von “wolffailalpha” und “epic fail”, da weder die Suche noch der Stream funktioniert und die Leute natürlich unterhalten werden wollen. Bekanntlich werden aber auch Space-Shuttle-Starts alle paar Minuten verschoben.

Die 5-6 großen “general awareness” Displays in der Mitte des Raums zeigen verschiedene Statusinformationen des Serverclusters. Auf dem linken Monitor wird der eingehende Traffic mit GeoIP Zuordnung dargestellt, um zu verfolgen, aus welcher Region der Welt der Traffic kommt. Auf dem rechten Monitor wird eingehender Traffic nach Ländern aufgelistet. Hauptsächlich dient dieser Monitor dazu, Zugangsprobleme zur Suchmaschine aus den einzelnen Ländern zu lokalisieren. Zusätzlich wird der eingehende Traffic nach Referrer aufgelistet, um zu sehen, ob eine Anfrage von Yahoo, MSN, Google oder anderen Webseiten kommt. In der Mitte sieht man die Queries die in jeder Sekunde durchgeführt werden. Es ist eine Anzeige der totalen Systemlast. Ganz rechts befindet sich ein Monitor, der die Query-Länge anzeigt. Man will überlange Queries, die auf Exploits hindeuten könnten, im Auge behalten.

Um 2:30Uhr funktioniert der Videostream endlich reibungslos und Stephen Wolfram übergibt die Moderation an zwei seiner Mitstreiter. Gerade denke ich noch, dass der Livestream nicht nach einer professionellen Produktion aussieht, da wird es bestätigt. Das professionelle Produkt sei die Suchmaschine, nicht eine Fernsehshow. Die Zuschauer werden nun darüber informiert, dass rund um das Rechenzentrum in Champaign, Illinois, USA ein schweres Unwetter aufgezogen ist und es nach einer Tornado-Warnung aussieht. Für die ca. 100 Leute werden 12 Taschenlampen bereitgestellt. Einige Blitzeinschläge in der unmittelbaren Nähe hätten zu kleineren Stromproblemen geführt. Im Livestream läuft prompt ein Videoschnipsel an, der das Powerbackup des Rechenzentrums zeigt.

Der lokale Cluster in Champgain, IL besteht aus 4000 Prozessoren aus der DELL Supercomputerline. Es sind nur zwei schwarze Schränke in einem Kühlraum. Sie verbrauchen nahezu die gesamte Energie, die für das Rechenzentrum zur Verfügung steht. Das System ist redundant, d.h. wenn ein Knoten ausfällt, übernimmt ein anderer seine Aufgabe. Es gibt gespiegelte Database-Storages und mehrere Webnodes.

Eine Abfrage an ein normales “Suchmaschinen”-Rechenzentrum ist im Prinzip eine Abfrage an die Harddisk. Es werden dabei keine Berechnungen durchgeführt, sondern gecachter Content zurückgeliefert, den ein Spiderdienst vorher eingesammelt hat. Jede komplexere Anfrage an “Wolfram Alpha” erzeugt jedoch zusätzlich zur Diskanfrage immer auch eine hohe CPU Last, um die Daten anhand der formalen Modelle zu berechnen und zu visualisieren. Das kann folglich nur ein Supercomputer – oder besser noch ein Supercomputercluster leisten. Man spricht von High-Performance Computing (HPC).

Solche High-Performance Computing-Systeme lassen sich in fast jeder Volkswirtschaft von der Hand abzählen. Sie werden beim wissenschaftlichen Rechnen verwendet, etwa in der Meterologie, der Teilchenphysik oder im Bereich der Strömungsmechanik, aber auch in der Finanzmathematik. In Deutschland gibt es derartige Hochleistungsrechenzentren unter anderem in München, Stuttgart, Karlsruhe und Jülich und Garching.

Der leistungsfähigste deutsche Supercomputer heißt “JUGENE” und befindet sich im Forschungszentrum Juelich (FZJ). Er rangiert auf Position 11 in der TOP500 Liste der Supercomputer vom November 2008.
Die Nummer 2 in Deutschland ist “Genius”. Ein Supercomputer im Rechenzentrum Garching (RZG) der Max-Planck-Gesellschaft und des Instituts für Plasmaphysik auf dem Berechnungen für das Fusionsexperiment Wendelstein 7-X in Greifswald durchgeführt werden.

In der TOP500 Liste der Supercomputer vom Juni 2008 rangiert einer der “Wolfram Alpha” Supercomputer auf Position 44. Er wurde durch die Firma R Systems realisiert und nennt sich “R Smarr”. Zum Zeitpunkt des Projektstarts gibts es 5 Wolfram Alpha Rechenzentren in den USA und weltweit werden weitere hinzukommen.

Es ist 3:15Uhr und ich bin erstaunlicherweise über eine Backdoor mit einigen Anfragen durchgekommen. Das System beantwortet die Anfragen allerdings nur sehr schleppend, da es sich um einen Testcluster handelt, auf dem gerade ein Belastungstest durchgeführt wird. Dieser Load-Test scheint dem System ordentlich zuzusetzen.

Meine ersten Anfragen an Wolfram Alpha:
1. Eine Gleichung
Der Interpreter für mathematische Eingaben erkennt die lausigsten und sogar meine deppernden Eingaben. Die Funktion lässt sich direkt ins Mathematica Notebook downloaden und übernehmen. Auch ein PDF Export ist möglich. Wunderbar – es läuft also.

2. Warum ist der Himmel blau?
Ok, das muss natürlich in Englisch gefragt werden.

3. Herr Eder, Bitte erklären Sie sich: Was Bitte ist das Wolfram Alpha Logo?

4. Auch “JP Morgan Chase” die größte Bank der USA is dem System nicht gänzlich unbekannt.

5. “Ford, Daimler, Nissan, BMW“: ok. Allerdings sind VW, Suzuki und andere Autohersteller dem System gänzlich unbekannt. Es ist eine leichte Überforderung festzustellen.

6. Eine vergleichende Länderabfrage

7. Es folgen einige unterhaltsame Queries: The Answer to life, To be or not to be. Auch die Antwort auf den Zungenbrecher “Woodchuck chuck” bleibt WA nicht schuldig.

Meine nächsten Anfragen schlagen fehl. Im Kontrollraum hat man keine Statusanzeige und versucht das Logging des Clusters zu patchen.

Es ist 4:00 Uhr und im Videostream verfolgen 4.300 Zuschauer einen Sachsen, der auf Englisch vermittelt, wozu Mathematica in der Lage ist. Im dazugehörigen Livechat postet der Nutzer “utfiedler” zeitgleich: “wolfram alpha – giving you access to information no one has ever cared about before in the history of the earth.” Die Webseite des Streams verzeichnete bis dahin 48000 Besucher. Es gehen kurzzeitig wieder einige Abfragen über die Backdoor, bis um 4:26 Uhr der Zugang über die Backdoor komplett down ist. Der Server streikt aufgrund von Queries und Loadtests.

Um 4:30 Uhr entscheidet Stephan Wolfram “live-zu-gehen”.
Er gibt den Befehl: “Everyone who is doing load-testing: cut it off!”, setzt sich an seinen Desk und klickt auf den großen “Activate-Button” unmittelbar vor ihm auf dem Schirm.

Nachdem ich den Browsercache geleert und die Seite der Suchmaschine nochmals aufgerufen habe funktioniert alles reibungslos. Ich jage haufenweise Queries über das System und staune über die Diagramme, Koordinatensysteme und Darstellungen. Das Beeindruckende ist, dass die Daten mit Hilfe der Modelle der jeweiligen Wissensdomänen, sei es nun Strömungsmechanik oder Biologe, visualisiert werden. Jede Abfrage an das System wird interpretiert, an die Teileinheit von Mathematica mit dem entsprechenden Modell weitergereicht, berechnet und schließlich zu einem Output transformiert.

Im Livestream wird währenddessen Stephen Wolfram auf eine, zumindest für meinen Geschmack, sehr “pushyige” Art zum Thema “New Kind of Science” (NKS) interviewt. Der Interviewer macht keine Anstalten Stephen Wolfram auch nur Ansatzweise aussprechen zu lassen.

Wolfram beginnt das philosophische Gebäude hinter dem Projekt und seinen Glauben an eine große Metatheorie, bei der alle Dinge durch eine mathematische Formel miteinander verbunden sind, zu entfalten. Er ist der Auffassung, dass kleine Modelle und Einheiten aus jedem Wissenschaftsbereich Relevanz für andere Wissenschaftsbereiche haben und jedes eine wiederverwendbare Problemlösungskomponente darstellt. Er spricht von einfachen Programmen, die mit wenigen Sätzen zu beschreiben sind und von Komplexität, die durch Kombination von einfachen Programmen reduziert und bewältigt werden kann. Wolfram Alpha diene dazu eine Vielzahl von wissenschaftlichen Modellen besser referenzierbar und verfügbarer zu machen – es sei eine Wissensmaschine.

Es ist 5:45 Uhr und der Livecast wird mit den Worten “Plese give Feedback. Enter your Queries. Goodnight.” beendet.

Die Offenheit und Abenteuerlust war und ist beeindruckend.
Danke fürs teilhaben lassen.

Tags: , , . Comments Off on Wolfram Alpha – “particularity”

Comments are closed.