#3: Daten gibt es genug - die Kunst ist das Weglassen. Nicht jede Meldung ist Markt: Quoniam jagt das echte Signal

Shownotes

Im dritten Teil von "Generation Data" wird aus der Nachrichtenflut ein Anlageprozess. Dr. Markus Ebner von Quoniam erklärt, warum das eigentliche Problem längst nicht mehr der Datenmangel ist, sondern das Datenübergewicht. Täglich laufen mehr als 1,5 Mio. Artikel durch die Systeme. Doch nicht jede Schlagzeile bewegt die Märkte, und nicht jede Wiederholung liefert neue Erkenntnisse. Entscheidend ist der Filter: seriöse journalistische Quellen statt Social-Media-Rauschen, Themen mit Marktbezug statt Datenballast, Ausblick statt Rückspiegel. Quoniam reduziert über 50.000 Themenfelder zunächst KI-gestützt und dann mit Analystenverstand auf die wirklich relevanten Signale. Daraus entstehen konkrete Positionen in Aktienindex-Futures, Renten-Futures und Währungen. Ebner betont: Das ist keine Blackbox und keine KI-Magie, sondern ein nachvollziehbarer Werkzeugkasten. Das Ergebnis ist eine "Global-Data-Sentiment-Strategie" (LU3056066932) mit über fünf Jahren Track Record, rund 12 % p.a., niedriger Korrelation zu Aktien und Anleihen und seit Jahresbeginn einem Plus von mehr als 6 %. Kurz gesagt: Quoniam handelt nicht den Lärm, sondern das, was nach dem Filtern übrig bleibt.

Transkript anzeigen

00:00:01: Märkte sind laut, Daten sind präzise.

00:00:05: Willkommen bei Generation Data dem Podcast über systematisches Investieren und KI im Asset Management!

00:00:15: Willkommen zu Teil drei unserer Podcastreihe Generation Data.

00:00:20: In den ersten beiden Folgen ging es darum warum Märkte oft Erwartungen handeln und warum Sprache manchmal schneller dreht als jeder Chart.

00:00:28: Heute drehen wir die Schraube ein bisschen weiter.

00:00:30: Wie wird aus einer Nachrichtenlawine am Ende ein investierbares Signal?

00:00:35: Oder anders gefragt, wie findet man im globalen Schlagzeilen Heuhaufen nicht nur die Nadel sondern baut daraus auch noch ein Portfolio.

00:00:44: Mein Gast wieder Dr.

00:00:45: Markus Ebner Grüß dich.

00:00:47: Hallo Peter freut mich jetzt zu sein.

00:00:49: Aus

00:00:49: dem Börsenradestödel grüßt Peter Heinrich.

00:00:52: Markus.

00:00:53: wir haben heute kein Datenproblem mehr Wir haben eher einen Datenübergewicht.

00:00:58: Also die spannende Frage ist also nicht Wie komme ich an die Nachricht dran, sondern wie komme ich eine Nachricht an die Aussage, die für Anleger wirklich zählt?

00:01:07: Ja das ist wirklich die spannende Frage und das ist die eigentliche Herausforderung.

00:01:11: Mittlerweile sind Unmengen an Daten verfügbar sei es Satellitendaten, sei es Kreditkartendaten.

00:01:17: Wir fokussieren uns auf elektronisch verfügbare Zeitungsartikel, News-Artikel und wir sammeln wir auf täglicher Basis mehr als filtern die nach den Themengebieten für unsere Analysen gezeigt haben, dass sie wirklich die Märkte bewegen und auf Basis dieser Artikel leiten wir das Sentiment.

00:01:38: Die Stimmung der einzelnen Artikel ab und auf basis dieser Stimmung gehen wir long oder short Position ein in Aktienindex Futures, Rentenfutures und FX-Forwards.

00:01:49: Das Ganze bündeln wir in unserer Global Data Sentiment Strategie, für die wir mittlerweile auch schon einen Livetrack record von über fünf Jahren haben mit einer durchschnittlichen Panum-Perform von zwölf Prozent und das Ganze bei sehr niedrigen Korrelationswerten.

00:02:06: zu Aktien merken, Nullkomma eins bis Nullkommer zwei.

00:02:09: Und zur Rennen merken zwischen NullKommer zwei und NullCommer

00:02:12: drei.".

00:02:13: Wenn man das ganze überdenkt habe ich da vielleicht ein Denkfehler dass mehr Daten automatisch die bessere Entscheidung bringt?

00:02:19: Dabei wird doch erst dann etwas wertvoll wenn es eigentlich strukturiert wird gefiltert und von euch eingeordnet.

00:02:26: Genau, es kommt insbesondere auf die Qualität der Daten an.

00:02:29: Also mehr Daten bedeutet nicht unbedingt bessere Anlageentscheidung und wir arbeiten mit mehreren Datenanbietern zusammen, die schon mal eine gewisse Vorarbeit machen.

00:02:39: Das heißt sie ordnen in jedem Zeitungsartikel ein Themengebiet zu beispielsweise Themengebieteninflation oder Themengebiete Mergers and Acquisitions Announcements Und hier können wir schon im ersten Schritt einmal filtern.

00:02:52: welche Themen bewegen wirklich die Märkten?

00:02:54: Sportnachrichten eher weniger, klatsch und tratsch nicht unbedingt.

00:02:58: Aber eben makroökonomische oder Unternehmensnachichten.

00:03:02: die sind von Relevanz.

00:03:03: darüber hinaus bekommen wir auch von den Datenanbietern sogenannte Entitäten.

00:03:07: das können Personen sein wie im Artikel erwähnt werden Institutionen oder auch Länder.

00:03:13: auch das hilft uns bei der Zuordnung.

00:03:15: ist ein artikel beispielsweise was spanische Aktien oder eben über Aktien aus Großbritannien.

00:03:22: Das Grundproblem ist, Nachrichten sind oft eher nebel als Navigation.

00:03:26: Wenn man so auf eine riesige Datenmengen schaut... Wie viele sind das noch mal?

00:03:29: Also quasi Millionen von Datensätzen!

00:03:31: Hast du größte Störfaktor?

00:03:33: Redundanz fehlende Investitionsbezug oder schlicht zu viel Rückspiegel und zu wenig Zukunft?

00:03:38: Ja ich glaube da hast du alle relevanten Punkte oder fast alle relevante Punkte schon erwähnt.

00:03:42: Das Thema einmal Redundance ja natürlich müssen wir hier filtern.

00:03:46: gibt es redundante Artikel?

00:03:47: die wollen wir natürlich nichts mehr.

00:03:48: einmal verbinden neben der Rendudanz auch eben insbesondere die Tatsache, sind die Nachrichtenartikel eher rückwärtsgewandt oder eher vorwärz ausgerichtet.

00:03:58: Weil alles was rück wärts gewandt ist, ist ja bereits in den Preisen eingepreist.

00:04:03: deshalb bearbeiten wir hier auch mit KI-Methoden um eben innerhalb eines Artikels uns einmal anzuschauen okay welcher Teil des Artikells ist rückwritzgewandd?

00:04:13: Oder eine Beschreibung der aktuellen Situation?

00:04:15: Welcher Teile des Articles ist der Ausblick?

00:04:18: und so separieren wir schon einmal indem wir sagen, okay, wir ignorieren die Beschreibung der aktuellen Situation und fokussieren uns bei der Messung der Stimmung rein auf den Ausblick.

00:04:28: Aber warum ist Redundanz vielleicht doch nicht so ganz wichtig?

00:04:32: Weil wenn du eine Meldung öfters hast dann gibt es ja eine Bestätigung für diesen Trend vielleicht also die Bestätigungen über diese Nachricht.

00:04:39: Wir haben jetzt derzeit Iran kriegt.

00:04:41: da gibt's tausende von Meldungen.

00:04:42: aber Wenn eine Mellung aus mehreren Quellen aus unterschiedlichen Quellen kommt Dann wird sie doch eigentlich relevanter.

00:04:47: Das ist ein hundertprozentig korrekt.

00:04:49: Ich habe mich darauf bezogen, dass der selbe Artikel letztendlich von unterschiedlichen Datenanbietern mehrere Male angeboten wird und diese Redundanz wollen wir natürlich nicht haben.

00:05:00: Aber wie du sagst wenn etwas passiert an den Märkten dann wird auch stärker darüber geschrieben und öfters darüber geschrieben.

00:05:06: die Zeitungen fokussieren sich eben gerade auf dieses Thema Und insofern sammeln wir dann mehr Artikel.

00:05:13: zu einem Thema kommen da auch darüber hinaus eben auch noch einen stärkeren Trend in positiven oder im negativen.

00:05:20: Also das heißt nur weil etwas laut ist, ist es noch lange nicht relevant.

00:05:24: die Börse ist ja schließlich kein Lautstärken-Wettbewerb.

00:05:27: Warum trotzdem nicht alles rein werfen?

00:05:29: Du hast mir im Vorgespräch was Spannendes gesagt.

00:05:31: er arbeitet bewusst mit journalistischen Quellen und nicht mit Blogs oder Social Media.

00:05:36: Warum ist noch mehr in eurem Fall eben nicht automatisch noch besser?

00:05:40: Was sind das für Quellen

00:05:42: Wenn wir einen Schritt zurückgehen, unsere Research-Arbeiten hinsichtlich dieses Thema gehen sehr lange zurück.

00:05:48: Vor über zwölf Jahren waren wir als quantitativer Portfoliomanager damit beschäftigt insbesondere strukturierte Daten auszuwerken, sei es Dividendenschätzung oder Erningson Veränderung oder ähnliche Daten also reine quantitative Daten und damals wurde Twitter mehr und mehr populär und die Idee kam auf ob wir nicht einmal ein Research-Projekt starten, indem wir auch unstrukturierte Daten verarbeiten.

00:06:14: Und dieses Research-projekt hat uns sehr stark weitergebracht dahingehend, dass wir gelernt haben in die Cloud zu gehen, parallel processing anzubenden eben unstrukturierter Daten systematisch zu verarbeiten.

00:06:27: allerdings eine Anlagestrategie, eine systematische Anlagestrategie konnten wir daraus nicht ableiten.

00:06:32: das war aber so der Startpunkt, in dem wir eben viel Technik gelernt und auch die ein oder andere akademische Publikation konnten.

00:06:39: und der nächste Schritt war dann eben Social Media Daten, aber da war auch der Erfahrungswert das viel Neues in den Daten ist ein wenig Relevantes.

00:06:48: Und einige Jahre später wurden dann eben Zeitungsartikel elektronisch verfügbar und wir hatten uns einen Fokus darauf gerichtet.

00:06:56: und hier haben wir wirklich gesehen wenn wir einen systematischen Filterprozess anwenden dann können wir auch hier wirklich die Nadeln aus den Heuhaufen herausfiltern und eine Landlagestrategie generieren, die für unsere Kunden Mehrwirtschaft.

00:07:09: Also das ist eigentlich schöner Kontrast ein schönes Bild zur üblichen KI-Romantik.

00:07:13: also nicht jeder Datenhaufen ist quasi einen Datenschatz kann man sagen.

00:07:17: Gehen wir mal weiter quasi vom Signal zum Portfolio zu Filterlogik.

00:07:22: Nimmst du mal ganz praktisch mit durch so'n Prozess hast zum Beispiel wie aus einer unüberschaubaren Nachrichtenmenge Schritt für Schritt ein überschaubarer Themenfokus wird und am Ende ein Signal.

00:07:33: Der erste Schritt ist, indem wir nach dem Anbieter von den Zeitungsartikeln filtern.

00:07:38: Hier gibt es relevantere Anbiete wie die Financial Times beispielsweise oder auch Zeitschriften, die eben nicht unbedingt auf Finanznachrichten spezialisiert sind.

00:07:47: Das ist eben der erste Schritt.

00:07:48: Der zweite Schritt ist der Themenfilter wo wir uns anschauen okay welche Thematiken betreiben denn wirklich die Märkte?

00:07:56: Und hier gehen wir in zwei Schritten vor.

00:07:58: Der erste Schritt ist KI unterstützt, von unseren Datenanbietern bekommen wir mehr als fünfzigtausend verschiedene Themen angeboten.

00:08:05: und hier filtern wir im ersten Schritt mit der KI von fünfzig tausend auf Tausend Themen Gebiete runter, die eben aus statistischer Sicht Sinn ergeben.

00:08:16: aber hier sehen wir dass die KI doch noch sehr stark halluciniert wie man so schön sagt.

00:08:21: und dem zweiten Schritt sind dann unsere Research-Analysten.

00:08:24: Wir haben rund zwanzig bei der Kronium Themengebiet für Themengebiete durchgegangen und haben nochmal gefiltert, okay, welches gibt doch aus ökonomischer Sicht relevant?

00:08:34: Und nicht nur aus statistischer Sicht.

00:08:36: Ja das sind die Themengebieten, die wir gefiltered haben und dann schauen wir uns darüber hinaus auch noch an.

00:08:42: ist der Artikel wirklich relevant zu einem Themengebied.

00:08:46: Respektive dem richtigen Themengebien zugeordnet?

00:08:49: als Beispiel Wenn wir das Thema Inflation nehmen, wie dieser Begriff Inflacion in der Headline vorkommt oder den ersten ein zwei absetzen.

00:08:57: Dann kann man davon ausgehen dass der Artikel wirklich über das Thema inflation ist wenn das Thema inflation oder Schlagboteinflation zum ersten Mal in der Fußnote vorkommen wird er vom Datenanbieter zwar als Artikel Inflation zugeordnet ist aber wirklich nicht von Relevanz.

00:09:12: Das ist also der nächste Filterschritt, wo wir uns anschauen okay Ist der Artikel auch wirklich richtig zugeordnet?

00:09:17: Der Sinn dann schauen wir uns noch in dem letzten Schritt an ist auch wirklich an den Kapitalmärkten etwas passiert wird.

00:09:23: das ist ja schon erwähnt je mehr artikel geschrieben werden desto stärker kann man davon ausgehen dass da wirklich ein thema ist Dass die redakteure bewegt.

00:09:33: und wenn wir sehen dass wir wirklich flauter haben im Sinne von dass nur wenige artikel publiziert werden dann geht das nicht in unser Signal

00:09:40: ein.

00:09:40: Du sprachst von Datenanbietern und dir hat dann sozusagen alle Zeitungen abonniert, weil viele Artikel gibt es doch eigentlich nur so eine Paywall also diese ganzen Plus-Angebote sozusagen?

00:09:50: Das

00:09:50: ist richtig!

00:09:51: Also wir haben Datenanbieter die uns quasi hinter die Paywall bringen und auch Datenanbeater die reines Web Scraping machen, die quasi das gesamte World Wide Web auf tägliche Basis durch Forsten nach frei verfügbaren Artikeln die aus mehr als hundert Sprachen ins Englische übersetzen und uns im fünfzehn Minuten Takt anbieten.

00:10:11: Und so ist es eben wichtig, dass man komplementäre Datenanbieter hat um eben hier möglichst breiten Fundus an Daten zu haben.

00:10:20: Wie macht ihr das denn technisch?

00:10:21: Und wann passiert das Taxi über?

00:10:23: Kannst du bitte mal ohne Maschinenraum Deutsch erklären So nach dem Motto was fliegt sie erst raus Was bleibt übrig und wie läuft das im täglichen Arbeitsschritt bei euch ab?

00:10:32: Also wer drückt euch welche Knöpfe

00:10:33: Genau im täglichen Arbeitsschritt vor?

00:10:35: Abgeschwindigkeit ist sehr, sehr wichtig.

00:10:37: Weil das Sentiment sich relativ schnell auch verändern kann und schnell drehen können.

00:10:41: Deshalb laufen unsere Systeme automatisch.

00:10:44: um acht Uhr morgens werden die hochgefahren sammeln die Daten der letzten vierundzwanzig Stunden filtern die verarbeiten die Und ca.

00:10:53: Achtundfünfundvierzig werden sie uns als Portfoliomanager zur Verfügung gestellt, respektive die Signale, die daraus generiert wurden.

00:11:00: Wir machen nochmal ein Check ob die plausibel sind, ob die Daten richtig gezogen wurden und leiten dann eben die Trades an unseren Trading Desk weiter, die dann bei der Eröffnung von den europäischen Märkten gleich handelsfähig sind.

00:11:13: und eine Stunde später spätestens sind wir auch ausgefüllt mit unseren Trades.

00:11:17: und ja Geschwindigkeit ist deshalb wichtig weil wir sehen oftmals dreht sich einen Sentiment relativ zügig und wenn wir dieses Signal beispielsweise einen Tag später umsetzen würden, würde noch die Hälfte der Performance generieren.

00:11:31: Ja kann ich mal gut vorstellen.

00:11:32: also das ist der Punkt sozusagen wo aus der Datenarbeit tatsächlich Portfoliarbeit wird.

00:11:37: jetzt hatten wir gestern spannenderweise so ein verrückten Tag Flash Crash quasi nach oben.

00:11:43: wie schnell wart ihr da in so einem Tag?

00:11:45: Ja, wir sind sogar noch ein bisschen adaptiver gewesen.

00:11:47: Wir haben einen Tag zuvor unsere Aktienquote und so Netto-Aktienquote von rund fünfzig Prozent auf hundert Prozent erhöht weil die Stimmung schon gezeigt hat ja es ist sowohl Iran als auch Trumps sind beide laut aber beide wollen doch irgendwo eine Einigung erzählen und insofern waren wir schon am tag zuvor mit einer relativ deutlichen Aktienpositionierung implementiert und konnten eben gestern sehr sehr schön davon profitieren und wir sind auch mit der Strategie über sechs Prozent netto im Plus hier.

00:12:19: Das heißt, hier auch in turbulenten Marktphasen konnten wir uns sehr gut behaupten.

00:12:24: Das ist eine gute Performance.

00:12:26: gehen wir noch mal auf die Datenlage ein also nochmal die Idee quasi wann das passiert.

00:12:33: macht ihr das nur einmal am Tag oder passiert es auch öfters am Tag wenn besondere jetzt vielleicht politische Dinge passieren?

00:12:40: Also wir sind jetzt kein spezieller Intraday Trader, darauf sind wir nicht fokussiert.

00:12:44: Wir handeln normalerweise mehrere Male die Woche und in solchen Phasen wo es wirklich sehr turbulent zu geht, handeln wir einmal am Tag.

00:12:53: Das ist so die Trading-Frequenz mit der wir arbeiten.

00:12:57: Jetzt könnt ihr ein kritischer Investor sagen... Ja, ob privat oder institutioneller klingt ja beeindruckend.

00:13:03: Aber ist ein bisschen Black Box?

00:13:05: Was antwortest du auf diesen Einwand?

00:13:07: Für uns ist das.

00:13:08: letztendlich und auch für unsere Anleger ist es überhaupt keine Black Box weil wir jetzt endlich unser Signal auch rückwärts verfolgen können.

00:13:15: also wir sind beispielsweise Lorn den S&P, zwanzig Prozent.

00:13:19: Welche Themengebiete haben denn dazu geführt dass wir diese Lornposition eingegangen sind?

00:13:23: Sind das Unternehmensnachrichten, sind es makroökonomische Nachrichten... Also hier können wir wirklich von dem Signal auch wieder rückwärts gehen und können eindeutig identifizieren, welche Nachrichten wirklich zu dieser starken Übergewichtung oder auch unter Gewichtung geführt haben.

00:13:39: Also eure Toolbox ist quasi kein Oracles sondern ein sauber gebauter Werkzeugkasten?

00:13:44: Genau!

00:13:45: Wir sind ein systematischer quantitativer Manager und für unsere Kunden es ist wichtig dass sie jederzeit nachvollziehen können woher die Anlageentscheidung kommt um eben auch selbst beurteilen zu können.

00:13:56: Wie ist das, was aus Kundensicht Sinn ergibt oder eben nicht?

00:14:01: Gut wenn es ein Anleger oder ein Insti-Invester sagt klingt gut ich will nicht selbst täglich Millionen von Nachrichten sortieren sondern so einen Ansatz investierbar nutzen.

00:14:11: Was kann denn konkret tun, was bittest du an?

00:14:14: Für institutionelle Investoren kontaktieren sie Kwonionen.

00:14:17: wir helfen gerne weiter.

00:14:18: Wir bereiten gerne Informationen auf.

00:14:20: diese benötigen und für Privatanleger Quonium Datacentiment einfach googeln.

00:14:26: Sie finden uns und sie können auch investieren, wir haben auch eine Scherklasse für Privatanleger.

00:14:31: Der Engpass im Asset Management sind quasi nicht Daten sondern die Fähigkeit Geliwantes systematisch quasi vom Rauschen zu trennen.

00:14:40: Markus ich danke dir!

00:14:41: Vielen Dank Peter.

00:14:47: Das war Generation Data von Quoniam Asset Management.

00:14:51: Abonnieren Sie uns und bleiben Sie datenbasiert.

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.