Monday, 1. December 2008
Z! - Episode 134: Qimaya - Anwendung neuronaler Netze
Trackbacks
Qimaya - Neurosemantische Netze
Roy Uhlmann von Qimaya war Gast im Z! - Podcast und hat mal wieder was über ‘die beste Suchmaschine der Welt’ erzählt, die zumindest theoretisch funktionieren würden, wenn erst einmal, irgendwann dann das Ganze durchgetestet ...
Roy Uhlmann von Qimaya war Gast im Z! - Podcast und hat mal wieder was über ‘die beste Suchmaschine der Welt’ erzählt, die zumindest theoretisch funktionieren würden, wenn erst einmal, irgendwann dann das Ganze durchgetestet ...
Weblog: Stereophone Blog
Tracked: Dec 11, 16:58
Tracked: Dec 11, 16:58
Comments
Display comments as
(Linear | Threaded)
Your comment was successfully added.
Warning: This comment needs approval before it will be displayed
Warning: This comment needs approval before it will be displayed


Ich fand die letzten 2 Sendungen wirklich interessant!
Die Idee des neuronalen Netzwerkes kannte ich zwar schon vorher, aber ich hätte nicht gedacht, dass sie auch sinnvoll für Suchmaschinen genutzt werden kann.... Habe mich dann ein wenig bei der Konkurrenz herumgetrieben, die schon eine öffentliche Suche anbietet:
http://www.semager.de/
http://www.semager.de/blog/impressum/was-ist-semager/
Aber ehrlich gesagt hat mich der Test wieder auf den Boden zurückgeholt... Man kann zwar das Ziel erkennen wo es hin gehen soll, aber es wird wohl noch SEHR lange dauern, bis diese Technologie konkurrenzfähig zu den “Großen” ist.
Ich bin jetzt wirklich sehr gespannt wie sich diese Suchmaschinen weiterentwickeln (hoffentlich schneller als ich es vermute ;-P ) und hoffe, dass ihr kurz im Podcast erwähnt wenn Qimaya einen offenen Test plant...
Also wieder 2 dolle Sendungen! :)
Hi Patrick,
Semager ist kurz gesagt keine Konkurrenz für Qimaya. Semager verfolgt einen technisch völlig anderen Ansatz (Latent semantische Indizierung) und ist deshalb auch kein lernfähiges neuronales Netz. Qimaya ist hingegen in der Lage ein Verständnis über den Inhalt eines Dokuments zu erlangen.
Die Unterschiede hat mir übrigens Roy erklärt und auf Grund dessen haben wir uns entschieden Semager erst gar nicht zu erwähnen weil es keinerlei Verbindungen oder Ähnlichkeiten zu Qimaya gibt.
Beste Grüße und vielen Dank für dein Lob,
Timon
Um es nochmals deutlich zu sagen, Qimaya ist keine Suchmaschine. Qimaya ist ein neuronales Netz, dass in der Lage ist Semantik ohne Mustervorgaben zu erlernen. Eine mögliche Darstellungsform der Informationen wäre z.B. auch die Informationen aus mehreren Quellen in eigenen Sätzen z.B. als Antwort auf eine Frage darzustellen. Somit ist Qimaya weit mehr als eine Suchmaschine die Trefferlisten generiert.
Danke für die schnelle Antwort und die Klarstellung.
Ich hatte eigentlich gedacht, dass Semantik wegen der hohen Komplexität gar nicht ohne neuronal-lernendes Netz zu realisieren ist. Semager ist wohl eher “Semantik-Light”, hat aber wahrscheinlich einen nicht so hohen Ressourcenbedarf.
Dann bin ich ja beruhigt und kann doch sehr gespannt auf Qimaya sein :)
Das ist nicht ganz korrekt. Semager verwendet “neuronales Routing”, um die Korrelationen zwischen Suchanfragen zu berechnen. Semantik ist “lediglich” die Grundlage für das neuronale Netz.
Wenn wir es ganz genau machen, dann benutzt Semager Vektormodelle. Leider ohne Informationstheorie, sondern eben nur als statistisches Berechnungsmodell. Diese ist aber Grundlage für Semantik
D.h. die Wörter im Satz “Frau Angela Merkel sagt” werden aufgrund ihrer zueinander auftretenden Häufigkeit statistisch gewichtet. Da alle drei Wörter jedoch statistisch in oftmals gleicher Häufigkeit stehen bedeutet dies, dass das Wort “sagt” in der gleichen Korrelation steht wie “Frau”, “Angela” und “Merkel”.
Semantik = Bedeutungslehre. Wenn also dem Wort “sagt” der gleiche Informations- bzw. Bedeutungsgehalt wie dem Wort “Frau” zugewiesen wird, so wird letztlich keine Semantik erzeugt. Oder alles ist eben semantisch ;)
Zum “neuronalen Routing” kann ich leider keine Aussage treffen. Zwar wurde beim Suma Kongress 2007 in Berlin dazu etwas vorgetragen, jedoch wurden damals lediglich ein Mashup älterer Technologien vorgestellt. Seitdem hat sich leider auch nichts bei den Patentämtern getan, daher kann ich dies aus wissenschaftlicher Sicht nicht beurteilen.
Das stimmt nur zu einem Teil. Bei Semager werden nicht einzelne Sätze oder Wörter analysiert, sondern der Text als ganzes, mit anderen Texten verglichen und daraus Ableitungen gezogen. Natürlich ist dies ein klassischer LSI Ansatz, die daraus gewonnenen Assoziationen werden dann noch durch verschiedene Clusterverfahren verfeinert. Semantik im Sinne der Definition ist das nicht, das ist korrekt, aber man kommt dem schon ziemlich Nahe.
Ich glaube Du hast das neuronale Routing dann aber noch nicht verstanden, da es kein MashUp ist, sondern definitiv neue Ansätze verwendet. Vielleicht ist das auf Folie nicht ganz deutlich geworden, aber das assoziative Netz, das wie oben erzeugt wird, verfügt über eine extrem hohe Komplexität, dass sich hervorragend für jegliche neuronale “Experimente” eignet, da es in Art und Form einem neuronalen Netz mit allem was dazu gehört sehr ähnelt ;-).
PS: Software-Patente gibt es nur in den USA :-(