Europäische Sprachmodelle: Kann Europa im KI-Wettrennen mithalten? | Jan Plogsties, Sabine Weber

Shownotes

Während wir alle mehr und mehr auf den KI - vor allem dem Chatbot hype aufspringen, fragen wir uns bei Servus-KI ob wir uns hier nicht in eine große Abhängigkeit begeben. Deshalb schauen wir mit großem Interesse auf die aktuellen Entwicklungen in Europa. Denn wo wir erst befürchteten schon abgeschlagen zu sein, haben wir mit Mistral und anderen Europäischen KIs im globalen Rennen überraschend aufgeholt.

Wie sind also noch im Spiel. Aber wer sind die Spieler, wohin geht die Reise und was macht Europäische KI eigentlich anders? Heute reden wir darüber, warum Sprachmodelle aus der EU nicht nur Datenschutz, sondern auch kulturelle Vielfalt und Transparenz in Rennen bringen. Unsere heutigen Experten, Jan Plogsties und Dr. Sabine Weber erklären, wie Europa mit begrenzten Ressourcen, aber klaren Werten im globalen KI-Wettrennen punkten kann – und warum lokale Modelle für Unternehmen und Bürger einzigartige Chance bieten.

Von Open-Source-Initiativen bis zum EU AI Act: Europa nutzt seine Stärken, um souveräne, vertrauenswürdige KI zu entwickeln. Wie ist das mit euch? Welche KI Modelle nutzt ihr im Alltag? Hört rein uns sagt uns was euch bei Sprachmodellen wichtig ist.

Transkript anzeigen

00:00:00: Das globale KI-Wettrennen ist im vollen Gange und Chatbots sind längst Teil unseres Alltags geworden.

00:00:06: Aber wo steht Europa?

00:00:07: Und haben wir eine Chance aufzuholen?

00:00:14: Und damit herzlich willkommen zu ServusKI, deinem Forschungspodcast zum Thema künstliche Intelligenz der Uni Bamberg.

00:00:20: heute zum ersten Mal mit Lara!

00:00:22: Servus, Lara!

00:00:25: Also ich muss gestiegen dass sich dem Ganzen ein bisschen kritisch gegenüberstehe.

00:00:30: Ich weiß nicht, ob ich da so gut hinterstehen kann.

00:00:31: Kann das bei momentan so schnell auf ein KI-Zeitalter zuhetzen?

00:00:36: Kann ich verstehen.

00:00:36: also.

00:00:37: aber ich muss gestehen, ich selber nutze Chatbots mittlerweile richtig oft für Recherche Zusammenfassungen und um Sachen zu machen von denen ich keine Ahnung habe zum Beispiel meine Next Cloud Debuggen

00:00:48: Fair enough, aber ich benutze KI immer sehr vorsichtig weil ich vor allem Angst habe wegen Datenschutz.

00:00:55: Genau das ist ein Punkt eigentlich wo die europäische KI ja punkten kann.

00:01:00: also manchen Modelle sind ja frei zugänglich kannst du selbst auf dein Computer laden.

00:01:03: Ich hab mir zum Beispiel im Dezember letzten Jahres Miss Trall einfach mal auf den Rechner installiert.

00:01:08: Das löscht dann einfach komplett lokal.

00:01:10: ich kann unbegrenzt Dokumente hochladen und an den Bord zu den Dingen befragen.

00:01:14: das funktioniert richtig gut Und ich bin überrascht, wie gut es funktioniert.

00:01:18: Also ich glaube dass wir gerade erleben, wie Europa aufholt wird zwar gar nicht mit den Milliarden-Bedgets von OpenAI sondern mit etwas was uns auszeichnet und zwar Datenschutz.

00:01:29: transparent sondern klares Nein zur total Verwachung.

00:01:33: also man könnte auch sagen ein bisschen Respekt vom User.

00:01:36: Okay, das sagst du Lennart.

00:01:38: Aber ich würde lieber gerne unsere Experten dazu hören!

00:01:41: Heute zu Gast haben wir nämlich Jan Ploksdies der DKI-Strategie bei SOFI mitgestaltet und Dr.

00:01:47: Sabine Weber Mitglied von BAKAI die an der Uni Bambergforsch zur Sprachmodelle Schwerpunkte auf Robustheit und Erklärbarkeit.

00:01:54: Herzlich willkommen

00:01:57: Hallo

00:01:58: So und damit starten wir direkt mal rein.

00:02:00: Meine erste Frage geht an Sabine.

00:02:03: Wenn ich meiner Oma erklären müsste, was ein großes Sprachmodell, ein Large Language Model ist.

00:02:10: Wie würde ich das in einem Satz erklären?

00:02:13: Ein Large Language Modell ist eine Art, es ist eine Maschine die aus riesigen Mengen Texts also stellt ihr zehn Bibliotheken, hundert Bibliotägen vor gelernt hat, welche Wörter häufig miteinander vorkommen.

00:02:25: Also es ist quasi eine Maschine die Textstatistik gelernt hat und daher wirklich gut darin ist das nächstwahrscheinliche Wort vorherzusagen.

00:02:33: Das heißt wenn du diese Maschine jetzt hast und dir ja eine Frage stellst dann benutzt sie die Text.

00:02:39: Statistiken die sich aus diesen Texten abgeleitet haben will sagen dazu auch lernen dass diese dass diese Maschine dann vorher sagen kann, was ist denn jetzt das nächste beste Wort?

00:02:50: Und daraus wird Wort für Wort die Antwort zusammengesetzt und am Ende hast du eine Antwort auf deine Frage.

00:02:56: Eines der wichtigsten Dinge, die man über KI oder über Sprachmodelle verstehen sollte, ist, dass Sprachmodelle eben Modelle von Sprache sind nicht von der Welt nicht von Fakten, sondern einfach nur eine statistische Mittelwertsammlung davon welche Wörter miteinander vorkommen.

00:03:16: Und das ist etwas was für uns Menschen ein bisschen schwer zu begreifen sind denn wenn wir einen Satz lesen projizieren wir den sofort auf die Welt die wir kennen.

00:03:24: Wenn wir das Wort Baum sehen dann haben wir sofort das Bild vom Baum im Kopf.

00:03:29: aber für so ne KI is Baum jetzt nicht anders als Stuhl oder Nil fährt, oder morgen.

00:03:36: Das sind alles einfach nur

00:03:38: Textstrings-

00:03:39: oder Repräsentationen die diese Maschine gelernt hat wie in irgendeinem Verhältnis zu anderen Textstrings stehen.

00:03:45: das heißt da ist so ein bisschen die Gefahr weil wir einfach immer nur mit so Mittelwerten arbeiten.

00:03:50: das heißt wenn es irgendwie in den Trainingsdaten in dieser Bibliothek drei Meinungen zum Thema gibt dann wird das Modell wahrscheinlich die dominante Meinung wiedergeben oder wenn wir Pech haben den Mittelwert aus drei Meinungen, was unter Umständen für uns nicht ideal ist.

00:04:06: Wenn wir Fragen zu ganz bestimmten Themen haben oder vielleicht einen Spektrum Anmeinung zum Thema wissen müssen.

00:04:13: Also es kann sowohl einseitig als auch einfach falsch sein?

00:04:17: Genau!

00:04:17: Es kann richtig sein, es kann falsch sein und es kann einseidlich sein.

00:04:20: Deshalb ist es sehr wichtig dass wir eben Sprachmodelle als Modelle von Sprache begreifen.

00:04:25: das heißt wenn wir zb so etwas haben wollen, wie bitte fasst ihr mir einen Text zusammen?

00:04:31: Dann wissen wir ja was der Input ist und was der Output ist den wir erwarten können.

00:04:36: Wir können das irgendwie nachprüfen.

00:04:37: oder wenn wir sagen Bitte schreibt mir jetzt ein Python Programm dass dieses Problem löst Das können wir auch unter Umständen testen weil wir wissen okay das ist der input der uns interessiert.

00:04:48: Das ist die Erwartung, die wir in den Output haben.

00:04:50: Und da es ist ein bisschen kontrollierter und das ist quasi eigentlich der eigentliche Use Case wenn wir die Sprachmodelle als etwas begreifendes Sprache macht und nicht unbedingt etwas das Wissen repliziert weil da kommen wir so ein bisschen ins heiße Wasser Wenn wir jetzt anfangen nach Fakten oder Nischenwissen zu fragen.

00:05:10: Weil das ist etwas, da sind diese Modelle eigentlich gar nicht so gut drin.

00:05:14: Sabine, mega danke und ich fühle mich gerade ein bisschen exonerated!

00:05:17: Ich habe das Gefühl, du hast mich von der Einklarung über einen Grunder geschoben weil ich hab ja genauso so Code Debugging gemacht und Zusammenfassungen,

00:05:23: d.h.,

00:05:24: da bin ich einigermaßen safe unterwegs aber trotzdem... ich finde dass ein spannendes Spannungsfeld wo man sagt es ist so unfassbar praktisch und manchmal einfach verblüffend wie gut das irgendwie funktioniert und gleichzeitig ist es irgendwie wackelig.

00:05:39: Ich hab auch schon viel kaputt gemacht damit.

00:05:41: also ich habe schon Befehle befolgt, die nicht hätte befolgen sollen aber da waren zwei Idioten die miteinander geredet haben und einfach mal gemacht haben.

00:05:51: Jan du bist ja nun ein Experte du baust selber an einer KI an der Sophie hast früher an Trocken gearbeitet das heißt du bist mitten drin.

00:06:03: Gehst du da so mit, was Sabine gerade erzählt hast oder würdest du vielleicht noch etwas ergänzen zum Thema?

00:06:07: Was ist ein

00:06:08: Sprachmodell?".

00:06:09: Ja also ich fand das gut beschrieben, Sabine!

00:06:12: Es ist halt wie eine Art Karaoke-Maschine ja oder jemand der gut Karaoke kann.

00:06:17: Also der sozusagen ganz viele Texte, Muster, Regen und vor allem auch ich sage jetzt mal Logik schon, Logik oder Zusammenhänge die wir so sprechen, also die in Sprache enthalten sind diese Logik mit gelernt hat.

00:06:32: Und da gehört eben nicht nur dazu, dass diese ganze Bibliothek eintrainiert wird sondern dann kommt auch dieses Posttraining wo man sagt wenn ich diese Frage stelle was ist denn die beste Antwort?

00:06:43: Diese Interaktion davon hat man auch unzählige Datensätze rein trainiert und damit funktioniert dann diese Interaktionen wie mit so einem Menschen und dadurch fühlt sich das auch so beeindruckend und so nah an.

00:06:57: aber Ja, wie Sabine schon gesagt hat.

00:07:00: Das ist eine automatische Sprechmaschine, die manchmal auch daneben... Die Zube richtig klingt oft emotional und es gut anspricht aber eben manchmal auch daneben liegt und abdriftet.

00:07:15: Also die Aussage, Ki's können denken, ist in dem Sinne nicht richtig sondern das sind eher Nachahmer von Worten

00:07:25: Nachaber von Worten, aber auch von unserem Denken.

00:07:28: Also das was wir gedacht haben als Menschen und in Texte verfasst haben, dass ist schon auch drin.

00:07:33: also es sind ja auch die Robotik-Leute verlassen sich auf Sprachmodelle um zum Beispiel irgendeinem Roboter irgendwas anzu irgendwie eine Logik beizubringen bringen den Absatz von A nach B. Um zu verstehen da ist jetzt ein Apfel und so weiter...also diese Logik die drinnen steckt Die ist schon auch mit in der Sprache drin und damit auch in den Modellen.

00:07:54: Deswegen sind sie auf so mächtig!

00:07:56: Da muss ich an Wittgenstein denken, der hat doch mal gesagt die Grenzen meiner Sprache sind die Grenze in meiner Welt.

00:08:00: Mich hat das immer aufgeregt, ich denke eher an Bilder und ich fand das stimmt nicht.

00:08:04: aber vielleicht ist es ja bei der KI irgendwie was wo man sagt Ja für dich ist es irgendwie tatsächlich weil die Bilder sind oder hat hier noch etwas anderes.

00:08:11: also Ich spreche da jetzt kurz drauf an auch diese Dinge manchmal hört man eben von emergenten Fähigkeiten.

00:08:16: Das war irgendwann mal so ein bisschen hyped als es darum ging dass die Mathe Hausaufgaben dass sich auch inhaltlich korrekt gelöst hat, obwohl es ja eigentlich ein Sprachmodell ist und jetzt vielleicht gar keine Ahnung hat von Mathe.

00:08:26: Ja, sich eigene Modelle von der Welt zu machen das ist halt was wo wir irgendwie in das Territorium kommen, wo ich denke... was wir gerne hätten oder was uns so unheimlich leicht fällt, das uns das vorzustellen.

00:08:38: Wenn wir mit einer Maschine interagieren die Sprache produziert weil wie gesagt wir sind wirklich gepolt auf soziale Interaktion wenn da etwas mit uns interagiert projizieren wir der Intelligenz drauf.

00:08:50: und dann wenn wir jetzt mal sehen wie oh diese Matheaufgabe hat jetzt geklappt Dann denken wir auch vielleicht ist es eine emergenten Fähigkeit?

00:08:57: Vielleicht ist das was wo das Modell tatsächlich was gelernt hat was wir eben nicht beigebracht haben.

00:09:01: Die Systeme werden komplexer, gerade mit Agenten zusammen und die ganzen Reasoning-Fähigkeiten.

00:09:08: Da entsteht ja dann so eine Art... sich selbst verstärkende Logik umso will.

00:09:13: Ist das

00:09:13: ein Selbstgespräch oder?

00:09:14: Die KI, ich habe das mal beobachtet bei Mistral die redet dann so ein bisschen ah der User will wahrscheinlich sowieso und da da da, dann schleift er das so drei vier Mal durch mit die gleiche Frage und dann macht er irgendwann den Prompt quasi dem eigentlichen Output.

00:09:26: es fand nicht ganz spannend weil man das dabei wenn man zu Hause laufen lässt sehen kann dass was sonst in den Weboberflächen meistens versteckt ist

00:09:33: Richtig, ja genau.

00:09:34: Das ist cool wenn man das mal wirklich beobachten kann.

00:09:36: Man kann sich das dann herklicken manchmal und nochmal nachschauen.

00:09:39: aber es ist beeindruckend und man sieht was sozusagen durch dieses reasoning möglich wird.

00:09:44: Und ich glaube da sind schon auch Dinge möglich die wo wir sagen okay dass hätten wir jetzt so nicht erwartet Aber sagen Lösungen an die wir vielleicht selbst wo wir selbst nicht draufgekommen werden So als menschen Ja und das ist dann schon geht dann schon in den bereichen und sagen ok das ist jetzt Geht deutlich über eine wortreproduktionsmaschine hinaus.

00:10:02: Das ist faszinierend und ein bisschen gruselig.

00:10:04: Also das ist so wie du was gebaut hast, jetzt entgleitet ihr das komplett weil es irgendwie selber anfängt sich zu verbessern.

00:10:13: also was tolles und was scary ist.

00:10:16: Jetzt haben wir verstanden was ein Sprachmodell an sich ist.

00:10:20: mich wird jetzt interessieren wo kommt jetzt europäische KI in dem ganzen Kontext?

00:10:26: Warum brauchen wir europäische Kalle?

00:10:28: Und wie ist die anders als das, was wir eh schon kennen von OpenEye, iHBT.

00:10:35: Wir bauen ja auch an europäischen Sprachmodellen und hatten ganz bewusst uns von Anfang an dafür entschieden, europäisch Sprachen einen Blick zu nehmen, weil – wie du schon gesagt hast – das definiert auch mein Denken und tatsächlich auch unsere Kultur.

00:10:48: Also ich kann nicht einfach nur Texte übersetzen aus dem Englischen.

00:10:52: in Litauisch sagt man bestimmte Dinge anders und es entsteht auch eine gewisse Kultur, die da drin steckt.

00:10:59: Also Sprache über Kultur.

00:11:01: also wir haben gesagt okay wir nehmen europäische Sprachen in den Fokus für das Teugnprojekt.

00:11:07: Für SOFI haben wir das jetzt ein bisschen eingeengt.

00:11:08: um einfach zu sagen Performance ist wichtig aber trotzdem noch auf europäischen Daten dann natürlich viel sehr starken Thema Transparenz unterwegs zu sein, welche Trainingsdaten verwenden wir denn dafür?

00:11:23: Also sowohl Transparenz, aber eben auch Kompleien zu sein.

00:11:27: mit dem AI-Akt bekommen wir vielleicht noch drauf.

00:11:31: Das ist schon ein Thema was besonders wichtig für die Industrie ist zu sagen okay wir wissen genau was drinsteckt können also sozusagen auch davon für uns etwas ableiten wo wir sagen das können wir guten Gewissens bei uns laufen lassen zum Beispiel Modelle auch lokal laufig so klein zu machen energieeffizient bei uns im Unternehmen laufen lassen, weil wir vielleicht unser Daten gar nicht rausgeben wollen oder nicht dürfen und nicht können.

00:12:00: Also das sind so Aspekte die wir schon beim Design sozusagen mit reinkommen haben.

00:12:04: Das

00:12:05: sind ja durchaus politische Dimensionen.

00:12:07: Also im Betrieb wäre es das Thema Betriebsspionage, die dann ermöglicht wäre wenn ich jetzt wirklich einfach alles auf Chatchity hoch lade.

00:12:14: Ich hole mir da einen teuren Account dass sich unlimited hochladen kann, baue mir da eine Bibliothek auf oder was.

00:12:20: aber die Daten sind ja weg.

00:12:22: Ja, wir können ja noch ein Schritt weiter denken, was ist, wenn wir irgendwann mal Zölle auf Tokens kriegen?

00:12:28: Es ist auch ne Torenerität.

00:12:30: Naja also Moment Ja, gehen wir davon aus.

00:12:33: Wir können diese Cloud-Dienste per Plexity Google und OpenAI, wir können die alle nutzen und haben immer Zugriff drauf und bauen unsere Workflows darauf auf.

00:12:42: aber es ist ja nicht garantiert dass wir immer Zugrift darauf haben.

00:12:45: Wir wissen heute das bestimmte Waren und Güter mit Zölln belegt werden oder eben auch ganz abgeschnitten sein können davon.

00:12:52: Und das ist unfassbar schnell und wir sind alle so schnell darauf aufgesprungen, weil es halt doch irgendwas ist was extrem nützlich ist.

00:13:00: Genau und deshalb bin ich auch dankbar dass hier vorangeht auf dem europäischen Level und das es schon Modelle gibt, die man lokal laufen lassen kann.

00:13:08: Das macht vielleicht eine oder andere Zuhörer-Zuhörerin auch schon.

00:13:11: Kann ich nur empfehlen ist irgendwie echt ein cooles Feeling weil du gar nichts raus gibst und das Kulturelle habt ihr vielleicht auch schon mal erlebt.

00:13:18: Ich weiß nicht wie es dir geht.

00:13:19: Lacher dieses sketchy bt ich finde es halt manchmal ein bisschen schleimig und es fühlt sich halt vielleicht auch kulturell.

00:13:25: Es geht anders.

00:13:26: Also vielleicht ist es auch einfach, weil das ganz viel amerikanische Texte oder vielleicht sind auch die Prompten ein bisschen gefordert.

00:13:32: Hey, pamper den User total!

00:13:36: Aber ich finde es beim Mistral viel angenehmer als so ein bisschen relaxer.

00:13:39: Ja, ich finde dazu gibt es auch relativ viel Forschung mittlerweile zu schauen.

00:13:44: Was sind die kulturellen Grundeinnahmen an Namen, die LLMs machen?

00:13:49: Die rausgekommen ist zum Beispiel das, dass man schon irgendwie so Proms machen kann okay jetzt formuliert aber mal irgendwie für den deutschen kulturell Kontext oder für den vietamesischen Kulturellen Kontext und so weiter.

00:14:00: Aber dass die Grundannahme des Modells immer der amerikanische Kontext ist wenn man halt diese kulturellen Rahmenbedingungen nicht definiert, dass man quasi immer den amerikanischen Default bekommt.

00:14:13: Eine Sache die jetzt für unseren Kontext sehr wichtig ist das jedes Unternehmen eigentlich spezifisches Wissen hat, dass es gerne weitergeben möchte und behalten möchte und auch der Wertschöpfungskette ist.

00:14:28: Und deshalb ist es irgendwie wichtig dass wir so ein Modell zum Beispiel jetzt einkaufen können, Feintune können mit unseren eigenen Unternehmensdaten und dann einen KI-Modell haben das zum Beispiel genau die eigenen Prozesse kennt.

00:14:42: Und das ist halt etwas was Close Source Modelle komplett nicht können weil ich kann jetzt nicht irgendwie so ChatGPT einmal runterladen mit unseren Unternehmen eigenem Modellen Feintun und dann weiß es halt immer wie unsere Unternehmsprozesse laufen.

00:14:55: Das ist das ist was glaube ich kleine Spezialisierte Modelle eine unheimliche Stärke haben, weil wir können wirklich diese generellen Fähigkeiten fast etwas zusammen übersetzen.

00:15:06: Etwas kontextualisiert was für die sich?

00:15:09: und jene Frage das ist sehr mächtig wenn wir es in für ganz spezifische Kontexte anpassen können.

00:15:16: Für mich war das super überraschend im Dezember als jetzt Mistral irgendwie medialen dessen Aufmerksamkeit gekriegt hatte.

00:15:23: Die haben auch gesagt december war also der pump wurde zum ersten mal aufgeholt hat, nicht für Diepsig damals.

00:15:29: Aber wir haben ja eigentlich viel weniger Sourcen oder viel weniger Kohle.

00:15:33: der Strom ist teuer.

00:15:34: wie kriegen wir das hin?

00:15:35: und wer sind denn so?

00:15:38: die großen europäischen LLMs, die man vielleicht kennen muss jetzt abgesehen von natürliche Sophie was wir mit vollem Interesse verfolgen werden?

00:15:47: Klar also Mistrale ist auf jeden Fall sozusagen der europäische Sportwagen an der Also, muss man schon sagen.

00:15:54: Und das ist auch gut so und wir brauchen einen Zugpferd.

00:15:57: Wir hätten uns auch gewünscht dass Aleph Alpha in Deutschland vielleicht noch ein bisschen mehr Traction kriegt.

00:16:02: aber Sabine hat es auch schon gesagt es gibt eine Menge gute Open Source Modelle die veröffentlicht werden von auf deren Basis man eine Menge machen kann.

00:16:10: ich glaube aber so ein bisschen um bei der Auto analogie zu bleiben ist es glaube ich wichtig dass wir in der Lage sind in Europa nicht nur die Autos zu fahren sondern sie auch zu bauen.

00:16:20: Also, ich glaube wir müssen in der Lage sein diese Kette zu verstehen.

00:16:23: Zu sagen was ist Fine Tuning?

00:16:25: aber wie funktioniert auch Pre-Training?

00:16:27: Wie funktionieren die dieses Datenfiltern?

00:16:28: Wie kriege ich aus einer richtigen Internetdaten Menge die raus, die für mich nicht toxisch sind dass sich wirklich die die Datenqualität so hochhalten kann das das Modell gut wird?

00:16:38: und Ich glaube es ist alles einfach etwas.

00:16:41: In dieser ganzen Kette gibt's viele Dinge die man richtig oder falsch machen kann Und ich glaube da geben sie sich einfach den vielen Konsortien und Unternehmen Mühe alle Stufen richtig zu machen.

00:16:52: Das merken wir auch, es gibt nicht den einen Kniff mit dem man jetzt das Modell einfach nochmal zwanzig Prozent besser kriegt sondern man muss einfach alles richtig machen um überhaupt auf Augenhöhe zu kommen.

00:17:02: also wir versuchen jetzt bei Sophie ganz bewusst uns auf den Trainingsframeworks zu stützen.

00:17:07: Die absolute State of the Arts sind auch diese Mixture-of-Expert-Modelle, das sind also so Modelle wo man sagt nicht alle ganz so viele Parameter gleichzeitig am Start.

00:17:16: Das ist ein bisschen energieeffizienter und wir sind in der Forschung muss man sagen auch echt stark.

00:17:20: was für mich zu haben ist dieses Investitions-Ökosystem wo sagen richtig viel große Geld rein.

00:17:26: Also deswegen war ich jetzt auch beeindruckend.

00:17:28: Mistral hatte ja glaube ich letzte Woche noch mal eine neue Investitionsrunde haben wir auch ein neues Kapital gekriegt, wollen auch neue Rechenzentren selber bauen.

00:17:37: Also sie gehen da auch klar in die Richtung und ich glaube, da ist im Moment auch in Deutschland eine Menge Bewegung.

00:17:44: Ihr habt das gerade schon bisschen anklingen lassen.

00:17:47: Das hört sich an jetzt würden schon europäische Unternehmen auf europäischer KI setzen.

00:17:51: Könnt ihr vielleicht erklären was da der Vorteil ist bzw warum sollten mehr Unternehmen auf Europäische KI setzen?

00:17:59: Ja,

00:17:59: wir haben jetzt um bei der Auto-Analogie zu bleiben mit den Sportwegen oder den Formeln.

00:18:05: Wir fahren alle nicht Formel eins wagen und wir brauchen auch Bagger und irgendwie Stilverzeuge.

00:18:13: Und ich denke das ist was, was Unternehmen wirklich leisten können wenn sie sich nicht mit Google und OpenAI zusammen tun weil da einfach die Barriere... die das Unternehmensdaten abgehen können oder dass das Preise in die Höhe getrieben werden können, sondern wenn man sich eben im Europäischen Konsortium engagiert oder ein europäisches LLM nimmt.

00:18:37: Dann sind es Leute denen man mehr auf Augenhöhe begegnen kann weil man denselben gesicherten Rechtsrahmen hat und man kann dann sagen okay liebes KI-Unternehmen du gibst mir jetzt einen LLm hilft mir doch, wie ich das auf meinen Fall fein tun kann.

00:18:50: Hilf mir doch!

00:18:51: Wie ich das irgendwie für mein Unternehmen produktiv machen kann.

00:18:54: und ich glaube da haben wir eine große Stärke weil... Ich kann mir nicht vorstellen, dass irgendwie OpenAI jetzt eine Person zu einem Mittelständler in irgendeiner deutschen Kleinstadt schickt um denen vielleicht beizubringen wie man KI für den Produktionsprozess anpassen kann.

00:19:10: Aber das ist halt etwas was eben kleinere und lokale Unternehmen leisten können wo es halt nicht den Ferrari der LLMs braucht sondern wo es eben was spezifisches angepasstes braucht.

00:19:21: also wenn man eine europäische KI kauft kriegt man auch einen Arbeiter an die Hand, also ein Menschen der einem beibringt wie man das benutzt?

00:19:29: Als Frauenhofer sehe ich das schon als unseren Auftrag zu sagen.

00:19:33: Also Forschung in die Industrie zu bringen.

00:19:34: und dazu gehört in vielen Fällen dass man wirklich sich mal hinsetzt mit den Leuten und sagt was ist denn das Problem was ihr lösen wollt?

00:19:41: ja weil oft ist gerade bei kleinen Mittelständern eben nicht auch nicht die Kapazität.

00:19:45: so haben es eher so.

00:19:46: die Frage wir wollen partizipieren und haben allen Mitarbeiterinnen jetzt KI zur Verfügung gestellt aber wie kriegen wir sie in unsere Prozesse rein?

00:19:54: Ja, das was wir machen besser machen schneller machen durch KI.

00:19:57: Das muss doch gehen und dann muss man sich mal hinsetzen und schauen was für andere Daten brauchen wir da noch?

00:20:02: Was mit Sensor-Daten?

00:20:03: wie kriegen wir hier rein in so ein Modell oder... Was sind

00:20:06: Sensordaten?

00:20:08: Zum Beispiel die Temperatur bei der meine Maschine läuft oder bei welcher Drehzahl?

00:20:14: irgendwas passiert jetzt bei ... zum typischen Produktions- oder Fertigungsstreck.

00:20:18: Oder im Fahrzeug, ja?

00:20:19: Weil ich habe mich nach eine Menge Kameras und so weiter... Also wie kriege ich diese Daten rein in so ein Modell um irgendwas Sinnvolles rauszuziehen?

00:20:26: Da ist ne Menge an die Hand nehmen der Unternehmen wichtig und das ist was wir glaube ich auch gut mit dem Ökosystem leisten können wenn wir Leute auch gut ausbilden.

00:20:35: Da passiert viel!

00:20:36: Wir haben gute Leute, die aus den Unis in Hochschulen kommen aber ich glaub da können wir auch noch echt investieren.

00:20:43: also da hab' ich jetzt auch seine Grafik gesehen.

00:20:46: Jetzt in der Zeitung am Wochenende wäre so wie viele KI-Experten weltweit ausspuckt und da sind wir Europa okay, aber da geht noch was.

00:20:58: Wir könnten mehr tun!

00:21:00: Wer uns vorhin schon mal gehört, ähm... ...swei tausend sechsundzwanzig dieses Jahr noch kommt der EU-AI-Akt in irgendeiner Form.

00:21:08: Frage ganz plakativ!

00:21:10: Wird das jetzt der große Albtraum für die US-Konzern?

00:21:13: Ja weil die dann sagen hey du kannst Chatchity-Petier gar nicht mehr verwenden.

00:21:17: Das müssen wir irgendwie raus blocken oder machen mir jetzt was was effektiv nur uns in der Forschung und Entwicklung ausbremst.

00:21:25: Es ist natürlich weder noch ja.

00:21:26: also es wird in der Mitte passieren.

00:21:29: Es ist eine Chance auch drin.

00:21:31: Aber es ist natürlich auch eine echte Herausforderung für große Unternehmen, aber auch für uns die wir Modelle entwickeln.

00:21:37: Also das ist ne echte Compliance-Hörde auch ja.

00:21:39: Wir müssen also schon eigentlich beim Trainingsstaat jetzt schon Dinge berichten was wir vorhaben.

00:21:45: dann muss man nachweisen was mal für Trainingsdaten drin hat.

00:21:47: Das ist eine ganze Kette an Dokumentationen die man machen muss.

00:21:51: wenn wir diese Regulation gutmachen nicht nur sozusagen bürokratisch machen sondern sagen sie zu nützt und uns zu schützen, also unsere Daten zu schützen und auch Transparenz reinzukriegen in solche Modelle.

00:22:03: Dann ist es auch eine Chance für eine Öffnung im Markt das kleinere Anbieter da auch ne besseres Chancen haben.

00:22:10: ich glaube wird nicht passieren, dass die großen Unternehmen ähnlich wie das vielleicht sehen.

00:22:14: Jetzt wird es gerade gesagt mit dem Lock-in-Effekt bei Social Media her.

00:22:19: Also ich glaube nicht, dass wir... Dass die Firmen sich vom europäischen Markt verabschieden werden oder werden müssen, sondern sie werden diese Pflichten einhalten und einhalten können.

00:22:29: Ich glaube aber, dass für Unternehmen, die sind mit einem klaren Fokus auf Datenschutz und auf Privatsphäre unterwegs sind, dass da schon eine Chance drin liegt.

00:22:38: Aber wir dürfen müssen halt aufpassen, dass wir auch ein bisschen in den risikopasierten Ansatz fahren also nicht so Risiko-AWRs.

00:22:44: Wir wollen auf keinen Fall irgendein Risiko eingehen weil das ist praktisch unmöglich sondern man muss wenn man Technologie macht ja auch wer ein Auto gebaut hat.

00:22:52: ich mein hat am Anfang als man das Risiko gehabt das ist vielleicht nicht funktioniert.

00:22:57: Also man muss dann auch mit ein bisschen Mut reingehen und sagen wir probieren jetzt mal was aus wir gucken was passiert Und schauen dann, ob wir damit ein Problem kriegen.

00:23:07: Also ich glaube da dürfen wir sozusagen nicht auf der Seite vom Pferd runterfallen, dass wir alles richtig machen wollen und das wird nicht funktionieren.

00:23:14: Das ist ein Wild West!

00:23:15: Als das erste Auto erfunden wurde, wusste man auch nicht wie man es reguliert oder wie man sicherstellt dass wir alle Autos haben die funktionieren und die nicht gefährlich sind.

00:23:24: Und ich denke wir haben eine ähnliche Entwicklung hier, dass wir neue Technologie haben und da ist es auch ein Lerneffekt für uns als Gesellschaft.

00:23:32: Wie gehen wir damit um?

00:23:33: Wie wollen wir sicherstellen, dass Wir alle fern Zugang dazu haben Dass wir sicher damit sind dass wir natürlich Gefahren minimieren aber dass wir einfach nicht wissen, wohin die Zukunft geht und da müssen wir einfach mit rechnen.

00:23:47: Wenn jetzt Datenschutz sehr wichtig wird also gesetzlich verpflichtend ist es dann so dass die KI teurer wird und die Entwicklung langsamer macht?

00:23:57: das eine Brennze rein.

00:23:59: Wenn ich meinen Forscherhut wieder aufsetze, ist es natürlich super wenn wir Dokumentation haben.

00:24:03: Weil wenn wir dann diese Modelle hernehmen und die erforschen wollen zum Beispiel wenn es um Robustheit und Fairness geht je mehr wir über den Input des Modells, je mehr wie über die Architektur, über die Trainingsvoraussetzung wissen desto besser können wir tatsächlich erklären wie diese Systeme funktionieren.

00:24:24: und das wiederum füttert die nächste Generation an systemen die besser werden können.

00:24:28: wenn diese Systeme einfach Blackbox sind, die irgendein großes Unternehmen irgendwie macht und jeder kocht sein eigenes Süppchen.

00:24:33: Dann bremst das die Forschung aus weil wir einfach nicht davon profitieren können was irgendwie in der einen geschlossenen Unternehmen gelernt wird was in dem anderen geschlossenen Unternehmen gelernt hat weil es einfach nicht in den wissenschaftlichen Diskurs gerät.

00:24:45: aber wenn wir diese offenen Modelle haben dann bringt das natürlich auch die Forschungen voran und hoffentlich auch die nächste und übernächste Generation von Modellen.

00:24:53: also Wie gesagt, ich meine dass das mehr Regulation Sachen ausbremst sehe ich auch die potenzielle Gefahr.

00:25:03: Aber da muss man einfach eine Abwägung treffen von wie viel Risiko wollen wir eingehen und wieviel Sicherheit und Sicherheit.

00:25:11: für wen und in welchen Kontexten wollen wir garantieren?

00:25:14: Die große Frage ist natürlich, wer finanziert die europäische KI überhaupt?

00:25:20: Ist das staatliche Förderung oder private Investoren.

00:25:25: Ja also ich glaube es beides ja und ich habe schon gesagt haben wir im Wirtschaftsministerium jetzt gearbeitet, die uns finanzieren haben auch eine öffentliche Verantwortung sein, dass wenn wir KI bauen können wollen in Deutschland und dann müssen wir das auch unterstützen über die Ausbildung.

00:25:47: Da geht ja schon eine Menge Geld rein aber auch über Förderung von solchen Projekten.

00:25:53: Auch die EU engagiert sich da sehr und wir beantragen immer wieder Projekte damit Rechenzeit und ein Projektmittel haben für sowas.

00:26:02: Also ich glaube, da ist ein Förderauftrag da wenn das politisch gewollt ist und ich glaube es sollte politisch gewesen sein Wenn wir wirklich mitspielen wollen müssen wir große Infrastrukturen auch haben.

00:26:15: also Gigafactory ist das Stichwort ja.

00:26:17: die EU hat ja ausgeschrieben Wir wollen Gigafactories bauen in Europa und Deutschland wird sich bewerben.

00:26:22: Ich war jetzt auf so einem Workshop wo die Industrie dann gesagt hat was hätte sie eigentlich für Bedarfe an so einer Gigafactorie?

00:26:28: Da passiert viel und ich hoffe, dass Deutschland da auch eine kriegt.

00:26:32: Eine Gigafactory ist ein ganz großes KI-Rechenzentrum, was zur Richtung bis zu einem Gigawatt an Stromverbrauchen können.

00:26:43: Ich glaube das Ganze groß wird es nicht aber es wird zumindest viele hunderttausend Prozessoren also GPU Und die EU gibt da Geld dazu, aber es ist eine private Investition.

00:26:56: In Deutschland stellt sich so ein Konsortium auf wo Unternehmen, die das aufbauen wollen zusammen mit der europäischen Finanzierung dann so eine Gigafactory aufbauten wollen.

00:27:09: also da wird sie jetzt eine Bewerbung geben.

00:27:11: ich glaube dass es jetzt ja.

00:27:12: in dieser Zeit wird das jetzt an die EU abgegeben und dann wird es einen Runde geben, wo einer entschieden wird, wo stehen diese fünf?

00:27:20: Gigafactories in Europa.

00:27:22: Und das sieht man eben auch.

00:27:23: da ist eine Kombination aus privater Investitionen und öffentlichem Geld an drin.

00:27:27: Eine

00:27:28: andere Frage wäre noch, es gibt ja den schönen Spruch wenn etwas kostenloses dann bezahlt man sein Daten?

00:27:35: In diesem Fall solls ja.

00:27:36: Datenschutz ist das große Thema von europäischer KI.

00:27:40: also es ist nicht so dass wenn man was kostenlose KI nutzt, dass man seinen Daten dann bezahlen

00:27:47: kommt auf was man nutzt, also ich denke das ist dann sehr individuell.

00:27:50: Ich würde nicht sagen dass

00:27:52: nur

00:27:52: weil ein Unternehmen europäisch ist es jetzt nicht dieses Geschäftsmodell haben kann.

00:27:59: Aber wahrscheinlich gibt's einfach andere Anreize, dass wenn man zu einem europäischen Unternehmen geht, da vielleicht gerade hin, weil sie das nicht tun und das ist etwas mit die Wärmung machen.

00:28:08: Ja aber du hast schon recht!

00:28:09: Also am Ende muss es wirtschaftlich funktionieren für das Unternehmen und wenn das das kostenlos anbietet, muss es natürlich irgendwas mit den Daten.

00:28:17: Das heißt ja noch nicht, dass es die Daten so eins zu eins im Klartext irgendwie weiterverkauft.

00:28:23: Es kann ja auch sein, sie sind zum Training des eigenen Modells.

00:28:26: Das muss man sich im Klaren sein und das passiert natürlich.

00:28:29: Die Promps mit genutzt werden um die nächste Generation zu trainieren

00:28:35: z.B.,

00:28:36: aber das muss man dann eben im Detail anschauen.

00:28:38: Das ist genau die Transparenz wo ich sage, die müsste einfach und klar und ersichtlich sein.

00:28:43: wenn das wäre eine super super Output von einem AI-Act, dass man sagt okay ich erkenne was passiert.

00:28:49: Ich erkenna die Daten gehen nur nach Europa oder sie bleiben in Deutschland.

00:28:53: Sie werden nicht zum Training verwendet ja oder nein?

00:28:56: Also das mir so eine einfache Markierung hätte, dass wir uns gar nicht irgendwie überlegen müssten wo kann ich denn die Nutzungsbedingungen finden?

00:29:04: und sowas wäre für mich so pragmatische Ansatz.

00:29:09: Weil wenn man jetzt mit Unternehmen spricht und sagt, okay wo habt ihr was nutzt ihr jetzt?

00:29:12: Das ist ja immer die Einstiegsfrage.

00:29:13: Wenn wir Unternehmen reden dann sagen wir benutzen da etwas von Microsoft und das ist dann irgendwo in der Cloud.

00:29:18: Und ja ja die haben uns zugesichert dass es alles in Europa.

00:29:23: aber es ist ja klar, dass wenn nach amerikanischem Recht hätte der Staat in Amerika Zugriff auf diese Daten also er kann das verlangen von Microsoft.

00:29:31: ja und Microsoft kann es nicht verhindern.

00:29:35: Das heißt, man muss einem klar sein dass man als Unternehmen da schon mit einem gewissen Risiko lebt und es ist vielen gar nicht so richtig klar.

00:29:43: Also das viel mehr Vertrauen noch da im Moment als vielleicht gerechtfertigt ist.

00:29:47: Uff!

00:29:48: Aber jetzt habt ihr schon fast ein paar Sachen beantwortet für die Abschlussfrage und zwar was müsste passieren damit wir in fünf Jahren nicht mehr fragen können wir mit Europa mithalten?

00:29:59: Sondern...

00:30:01: Ja, wir können mithhalten.

00:30:03: Ich finde diese Wettrennmetapher gar nicht so passend, weil ehrlich gesagt es ist irgendwie nicht den einen großen irgendwie... Weg den wir alle in eine Richtung gehen, sondern ich finde.

00:30:15: Wir sind gerade stark in unserer Diversität dass wir so viele verschiedene Sprachen haben das wir irgendwie in Deutschland sehr diversen Mittelstand haben wo wir Unternehmen haben die wirklich Weltmarktführer sind für ein ganz bestimmtes Teil.

00:30:29: und das ist das war unsere Stärke und es sollte unsere Stärken bleiben weil wir dieses Know-how jetzt haben Und wir können KI mit diesem know how verbinden

00:30:38: um

00:30:39: quasi das weiter in die Zukunft zu tragen oder neue Geschäftsmodelle zu finden, wo wir diese Stärken kombinieren und in dem Sinne spielen wir eigentlich unter Umständen ganz anderes Spiel als Großunternehmen aus den USA oder China.

00:30:57: gar nicht unbedingt mit Chat-GPT in Konkurrenz stehen müssen, sondern weil wir einfach Potenziale in anderen Gebieten haben.

00:31:04: Also ich denke dass das so diese Wettrennenmetapher irgendwie nicht unbedingt passend für dafür ist wie ich zumindest die KI Entwicklung generell sehe.

00:31:13: Okay also du siehst es nicht als ein gradliniges Wettrennen, sondern eher so einen explorativen Weg.

00:31:19: wo es auch unterschiedliche Kartierungen gibt finde ich einen ganz interessanten Input.

00:31:24: Aber eine andere Frage, wollten wir nicht trotzdem?

00:31:27: Wollten wir nicht mit der europäischen LLM so was haben wie jetzt auch Mistral geworden ist.

00:31:31: Dass wir sagen Wir haben einen Equivalent ein Pendant zu diesen großen Sprachmodellen dass Leute auch im Alltag benutzen vielleicht auch kostenlos benutzen können um da unabhängig zu sein.

00:31:43: Ist das nicht auch etwas gewesen?

00:31:46: Ja aber Da geht's ja hin.

00:31:48: also ich sehe das.

00:31:50: Ich seh' Das wird es kriegen und Wir kriegen es vielleicht übermistral, wir kriegen es über andere Initiativen.

00:31:55: Und ich glaube, es gibt eine Menge Diversifikationen gerade in diesem Bereich also eben nicht nur sprachbar.

00:32:03: Das ist das was superpopuläres, was jeder kennt.

00:32:06: Sabine, da im Hintergrund sehe ich so ein Dinosaurier und da fällt mir ein... Es gab damals in dem Dinosariereich die sogenannte kambrische Explosion.

00:32:13: Ich weiß nicht ob du das kennst,

00:32:14: d.h.,

00:32:14: da wurden ganz viele... Neue Arten entstanden da in einem ganz kurzen Zeitraum und ich glaube das sind wir jetzt auch mit diesen Sprachmodellen.

00:32:21: Es gibt nicht nur, es wird diese paar große Dinosaurier geben ja aber es wird auch ganz viele geben die was ganz anders können.

00:32:27: Die eben was weiß ich dafür schneller laufen können aber dafür keine Fleischwasser sind oder so keine Ahnung also die aber ganz viele verschiedene Nischen finden.

00:32:39: Und ich glaube, das sehen wir gerade.

00:32:40: Es gibt Unternehmen die ihre Nischen finden wie im Steuerbereich oder im Finanzsektor oder eben gerade industriell.

00:32:49: da gibt es auch eine Menge Nischen was da eben ganz viel spezialisierte Daten noch gibt.

00:32:53: und diese Diversität ist super und basiert oft auf Open Source Modellen.

00:33:00: und damit wir auch heute in der Lage sind gute Open Source Modelle zu bauen, glaube ich müssen wir da auch rein investieren.

00:33:05: In welchen Zeit aber eben auch in Forschung?

00:33:07: Ich finde eigentlich auch was vielleicht die Stärke von europäischer KI ist genau das dass wir irgendwie als Bürgerinnen und Bürgern mit unseren Steuern dazu beitragen können irgendwie nicht diese großen Unternehmen haben, die unsere Daten von uns klauen und das ist wie wir bezahlen.

00:33:23: Sondern vielleicht bezahlen wir einfach wenn wir unsere Steuern bezahlen dafür dass wir bessere, bessere Infrastruktur bekommen.

00:33:31: also ich meine im Grunde genommen ist es so wie Straßen sowie Wasser sowie Strom.

00:33:34: das sind auch Sachen wo wir irgendwie jetzt daran gewöhnt sind dass der Staat uns garantiert dass wir Zugang zu diesen Dingen haben oder dass diese Dinge irgendwie sicher und zuverlässig sind voran, dass wir vielleicht auch über KI auf diese Art und Weise nachdenken.

00:33:51: Dass wir irgendwie eine Verpflichtung dazu haben die Infrastruktur zu schaffen.

00:33:54: Das

00:33:54: klingt richtig gut weil wir am Anfang auch gesagt KI ist nicht mehr wegzudenken aus dem Alltag.

00:33:59: also es ist eigentlich nur fair das wir alle ein bisschen was dabei tragen dass wir's haben.

00:34:04: Ja dann würdest du auch wieder mit ein bisschen weniger Skepsis einziehen können wenn wir das so machen wie unsere Abine erzählt haben?

00:34:11: Also ich fühle mich jetzt auf jeden Fall sehr viel besser, wenn ich europäische KI benutze mit dem Datenschutz und die Transparenz.

00:34:18: Vielen Dank!

00:34:19: Vielen vielen dank.

00:34:20: das war ein total aufschlussreiches und spannendes Gespräch.

00:34:23: Danke für all eure Insights und eure Visionen, die jetzt für die europäischen Sprachmodelle mitgeteilt haben.

00:34:31: Ganz ganz herzlichen Dank.

00:34:32: schön dass ihr heute da wart.

00:34:33: Ja vielen Dank an euch.

00:34:35: es war schön diese Unterhaltung mit euch zu haben.

00:34:37: Absolut

00:34:38: danke Lara und Lennart.

00:34:39: echt coole Podcast.

00:34:41: Das war's für uns für heute mit Servus, Kai.

00:34:43: Wir sehen und hören uns beim nächsten Mal bis dahin!

00:34:46: Servus.

Shownotes

Transkript anzeigen

Neuer Kommentar