Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

11.06.2026
  • Zwei Beiträge zu MoE-spezifischen Quantisierungsalgorithmen wurden für einen Workshop angenommen, der im Rahmen der ICML 2026 abgehalten wird
  • Die Auszeichnung folgt auf den Gesamtsieg von Nota AI beim NVIDIA Nemotron Hackathon
  • Stärkung der zentralen Optimierungstechnologien, um große KI-Modelle zu verkleinern und ihre Ausführung effizienter zu gestalten

SEOUL, Südkorea, 11. Juni 2026 /PRNewswire/ -- Nota AI, ein auf die Komprimierung und Optimierung von KI-Modellen spezialisiertes Unternehmen, gab bekannt, dass zwei seiner Beiträge zu MoE-spezifischen Quantisierungsalgorithmen für den Workshop „Resource-Adaptive Foundation Model Inference (AdaptFM)" im Rahmen der ICML 2026, einer der weltweit führenden Konferenzen für maschinelles Lernen, angenommen wurden.

Die ICML gilt allgemein als eine der weltweit führenden Konferenzen im Bereich des maschinellen Lernens und der künstlichen Intelligenz und vereint die neuesten Forschungsergebnisse von globalen Technologieunternehmen, führenden Universitäten und bedeutenden Forschungseinrichtungen. Der AdaptFM-Workshop konzentriert sich auf Technologien, die es ermöglichen, groß angelegte KI-Modelle unter begrenzten Rechenressourcen effizient auszuführen. Forscher von globalen Unternehmen und Forschungseinrichtungen, darunter Amazon und Meta, sind im Organisationskomitee vertreten, während Forscher von führenden KI-Unternehmen wie NVIDIA, Qualcomm AI Research, OpenAI, Apple und Microsoft ebenfalls als Mitglieder des Programmkomitees teilnehmen.

Diese Leistung ist von großer Bedeutung, da sie das gesammelte technische Know-how von Nota AI bei der Optimierung von Mixture-of-Experts (MoE)-Modellen würdigt – einer Architektur, die zunehmend als Kernstruktur für große Sprachmodelle (LLMs) angesehen wird. MoE-Modelle verbessern sowohl die Leistung als auch die Effizienz, indem sie je nach Bedarf nur eine Teilmenge von Expertenmodellen aktivieren. Ihre komplexe Struktur erfordert jedoch einen anderen Ansatz bei der Quantisierung – dem Prozess, Modelle kleiner und effizienter zu machen – als bei herkömmlichen Modellarchitekturen.

Nota AI gewann zuvor sowohl seinen eigenen Track als auch den Gesamtwettbewerb beim NVIDIA Nemotron Hackathon mit einer datengesteuerten MoE-Quantisierungsmethode. Mit der Annahme dieser beiden Beiträge wird Nota AI erneut Forschungsergebnisse, die speziell für MoE-Architekturen entwickelt wurden, auf einer globalen Forschungsbühne präsentieren.

Der erste angenommene Beitrag, „DREAM-MoE", schlägt eine Methode vor, um Veränderungen im Entscheidungsfluss eines Modells zu reduzieren, die auftreten können, wenn groß angelegte KI-Modelle über mehrere Segmente hinweg quantisiert werden. Die Methode konzentriert sich auf die Tatsache, dass selbst ein kleiner Fehler in einem früheren Segment die Expertenauswahl in späteren Segmenten beeinflussen kann. DREAM-MoE hilft dem quantisierten Modell dabei, Experten so auszuwählen, dass das Ergebnis näher am ursprünglichen Modell bleibt.

Die zweite Arbeit, „SRA-MoE", schlägt eine Methode vor, die wichtige Eingaben identifiziert und priorisiert, die einen größeren Einfluss auf die endgültige Ausgabe des Modells haben. Anstatt alle Eingaben gleich zu behandeln, ist SRA-MoE darauf ausgelegt, zu verhindern, dass die Expertenauswahl für diese Schlüssel-Eingaben erheblich gestört wird, was dazu beiträgt, die Modellqualität unter begrenzten Ressourcen effektiver aufrechtzuerhalten.

Beide Studien zeigten eine höhere Leistung im Vergleich zu den neuesten MoE-spezifischen Quantisierungsmethoden. Dies zeigt, dass groß angelegte KI-Modelle mit weniger Speicher und weniger Rechenressourcen ausgeführt werden können, während Qualitätsverluste reduziert werden. Weil die Kosten, der Stromverbrauch und die Hardware-Belastung beim Betrieb großer KI-Modelle weiter steigen, gewinnen MoE-spezifische Quantisierungstechnologien zunehmend an Bedeutung.

Nota AI hat seine Forschungs- und Entwicklungsbemühungen proaktiv auf die Optimierung großer KI-Modelle konzentriert, die erhebliche Speicher- und Rechenressourcen erfordern. Das Unternehmen treibt die Optimierung groß angelegter Modelle, darunter Solar MoE, als Teil des vom Upstage-Konsortium geleiteten Sovereign-Foundation-Model-Projekts voran. Zudem erweitert es seine Erfahrung bei der Quantisierung von NVIDIA Nemotron 3 Nano auf neuere große Modelle wie Nemotron Ultra und erweitert damit den Anwendungsbereich seiner Optimierungstechnologien weiter.

„Die Annahme dieses Beitrags spiegelt die kontinuierlichen Fortschritte von Nota AI bei MoE-spezifischen Quantisierungstechnologien wider", sagte Myungsu Chae, CEO von Nota AI. „Nach unserem Gesamtsieg beim NVIDIA Nemotron Hackathon freuen wir uns, unsere Forschungsergebnisse auf dem ICML 2026 AdaptFM Workshop zu präsentieren. Wir werden weiterhin Optimierungstechnologien entwickeln, die einen effizienteren und praktischeren Einsatz großer KI-Modelle ermöglichen."

Darüber hinaus wird Nota AI während der ICML 2026 im COEX in Seoul die „Nota AI – Korea Efficient Days" veranstalten. Die Veranstaltung bringt globale Forscher, Ingenieure und Führungskräfte aus der Wirtschaft zusammen, die Korea besuchen, um Forschungstrends und industrielle Anwendungen von Efficient AI auszutauschen. Im Rahmen der Veranstaltung plant Nota AI, seine Forschungsergebnisse zur Optimierung groß angelegter KI-Modelle vorzustellen und Möglichkeiten für technische Zusammenarbeit und geschäftliche Kontakte zu erweitern.

Cision View original content to download multimedia:https://www.prnewswire.com/de/pressemitteilungen/nota-ai-hat-zwei-beitrage-zur-moe-quantisierung-fur-den-icml-2026-workshop-eingereicht-und-beweist-damit-seine-weltweite-wettbewerbsfahigkeit-bei-der-optimierung-groW-angelegter-ki-projekte-302798010.html

Other news

Bundesrat stärkt Apotheken mit neuen Befugnissen bei Prävention und Therapie

15.06.2026

Apotheken in Deutschland erhalten deutlich mehr Handlungsspielraum: Der Bundesrat hat eine Reform der schwarz-roten Koalition passieren lassen, die die Rolle der Offizinen im Gesundheitswesen spürbar aufwertet. Ziel ist es, die wohnortnahe Versorgung zu stärken, Wartezeiten in Arztpraxen zu reduzieren und Prävention sowie Früherkennung auszubauen. Das Paket war zuvor bereits vom Bundestag beschlossen worden.

Kern der Reform ist ein erweitertes Leistungsangebot in Apotheken. Künftig sollen dort zusätzliche Vorsorge- und Früherkennungsuntersuchungen möglich sein, etwa zu Herz-Kreislauf-Erkrankungen, Diabetes oder Angeboten rund um das Rauchen. Apotheken können damit stärker als bisher in der Prävention ansetzen und Risiken identifizieren, bevor es zu manifesten Erkrankungen kommt.

Auch im Impfbereich werden die Kompetenzen ausgeweitet. Neben den bereits etablierten Grippe- und Corona-Impfungen dürfen Apotheken künftig alle Schutzimpfungen mit sogenannten Totimpfstoffen anbieten, darunter etwa Tetanus. Ergänzend werden Blutabnahmen erlaubt, etwa um Medikamentenwirkungen zu kontrollieren. Damit rücken Apotheken näher an klassische ärztliche Tätigkeitsfelder heran, ohne diese vollständig zu ersetzen.

Besonders sensibel ist die neue Möglichkeit, in eng begrenzten Fällen verschreibungspflichtige Medikamente ohne ärztliche Verordnung abzugeben. Erlaubt ist künftig die einmalige Ausgabe der kleinsten Packungsgröße auf Selbstzahlerbasis, wenn ein Arzneimittel seit längerem eingenommen wird und die Fortführung der Therapie keinen Aufschub erlaubt. Die Regelung soll Versorgungslücken schließen, etwa wenn ein Rezept nicht rechtzeitig vorliegt, und bleibt zugleich strikt begrenzt, um Missbrauch zu vermeiden.