RSS VentureBeat Notiz

RSS VentureBeat

VentureBeat ist eine renommierte Technologie-Nachrichten- und Analyse-Website, die sich auf die Berichterstattung über Innovationen und die sich rasch ändernde Welt der Technologie, Wissenschaft und der Zukunft der Arbeit konzentriert. Die Seite bietet genaue Berichterstattung, tiefgreifende Marktanalysen und scharfsinnige Kommentare zu Chancen und Herausforderungen bei aufstrebenden Technologien. Die Themenpalette umfasst ein breites Spektrum, darunter KI, Robotik, Blockchain, Gaming und vieles mehr. Die Berichterstattung beinhaltet Breaking News, Feature-Geschichten und Gastbeiträge, was eine vielfältige Palette an Inhalten für Leser schafft.

Notizfaden

KI-Agenten, die für 2025 als bedeutend vorhergesagt werden, stehen vor Herausforderungen bei der effektiven Durchführung mehrstufiger Aufgaben. Das von Forschern entwickelte EAGLET-Framework zielt darauf ab, die Leistung dieser Agenten bei Langzeitaufgaben zu verbessern. EAGLET verwendet einen "globalen Planer", um Agenten zu führen und Planungsfehler zu mindern, ohne dass eine manuelle Datenkennzeichnung oder ein erneutes Training erforderlich ist. Dieser Planer, der in einem zweistufigen Prozess feinabgestimmt wurde, generiert einen übergeordneten Plan, um Halluzinationen zu reduzieren und die Effizienz zu verbessern. Eine Schlüsselinnovation ist die Executor Capability Gain Reward (ECGR), die die Effektivität der generierten Pläne misst. Das Framework ist so konzipiert, dass es sich leicht in bestehende Agenten-Workflows integrieren lässt und die Leistung über verschiedene Modelle hinweg verbessert. EAGLET übertraf andere Planungsmethoden in Benchmark-Tests wie ScienceWorld und ALFWorld. Die Forschung zeigt verbesserte Aufgabenerledigungsraten und eine Reduzierung der für die Ausführung benötigten Schritte. Obwohl es vielversprechend ist, ist der Code noch nicht öffentlich verfügbar, was Fragen zur Implementierung aufwirft. Der Einsatz in Unternehmen steht vor zusätzlichen Herausforderungen in Bezug auf die einfache Integration, was weitere Untersuchungen zur praktischen Anwendung erfordert. Trotz dieser Überlegungen bietet EAGLET eine vielversprechende Strategie zur Verbesserung der Zuverlässigkeit und Effizienz von LLM-Agenten.
CdXz5zHNQW_QiHfat30sX.png
Visa hat das Trusted Agent Protocol eingeführt, um die Herausforderung zu meistern, legitime KI-Einkaufsassistenten von bösartigen Bots zu unterscheiden. Dieses Protokoll etabliert eine grundlegende Infrastruktur für agentenbasierten Handel, bei dem KI-Agenten autonom Produkte suchen, vergleichen und kaufen. Händler können jetzt kryptografisch überprüfen, ob diese KI-Agenten autorisiert und vertrauenswürdig sind, und so Datenabfragen und Betrug verhindern. Der von KI angetriebene Datenverkehr auf Einzelhandels-Websites ist drastisch gestiegen und überfordert bestehende Bot-Erkennungssysteme. Visas Protokoll verwendet einen kryptografischen Vertrauenshandshake, der von KI-Agenten verlangt, überprüft und mit einem eindeutigen digitalen Signaturschlüssel ausgestattet zu werden. Zugelassene Agenten übermitteln dann Informationen über ihre Absicht, Verbrauchererkennung und optional Zahlungsdetails. Händler überprüfen diese Signaturen, um die Vertrauenswürdigkeit der Agenten zu bestätigen, und das mit minimalen Änderungen an der bestehenden Infrastruktur. Visa arbeitet mit Unternehmen wie Cloudflare zusammen und setzt sich mit Wettbewerbern wie Google und OpenAI auseinander, um Branchenstandards zu etablieren. Das Protokoll wirft Fragen zur Haftung für nicht autorisierte Transaktionen auf, aber Visa betont seine Betrugspräventions-Systeme. Visas Rolle als Torwächter bei der Genehmigung von KI-Agenten könnte umstritten sein und möglicherweise größere Unternehmen bevorzugen. Das Protokoll wird während Visas rechtlicher Herausforderungen in Bezug auf Kreditkarten-Abhebegebühren und Debitkarten-Wege-Untersuchungen eingeführt. Visa erkennt an, dass eine weitverbreitete Akzeptanz Zeit brauchen wird, und konzentriert sich auf den Aufbau von Glaubwürdigkeit und die Demonstration von Wert. Analystenprognosen deuten darauf hin, dass die Akzeptanz der Händler von dem Wachstum der KI-Agenten bei der Abwicklung von Transaktionen abhängen wird. Visas Investitionen in KI zur Betrugsreduzierung und seine Expansion in neue Zahlungsbereiche, wie die Partnerschaft mit X für eine digitale Geldbörse, unterstreichen seine strategische Ausrichtung auf KI.
CdXz5zHNQW_X2wIYWRpyF.webp
Das Rose Rock Bridge (RRB) der Tulsa Innovation Labs ist ein gemeinnütziger Startup-Inkubator, der das Erbe der Energieindustrie von Tulsa nutzt, um nachhaltige Energietechnologie zu fördern. RRB zielt darauf ab, eine florierende Technologieökonomie zu schaffen, indem es lokales Fachwissen mit aufstrebenden Unternehmertalenten kombiniert. Das Programm arbeitet mit wichtigen Interessengruppen zusammen, um Frühphasen-Startups, die dringende Energieprobleme lösen, Ressourcen zur Verfügung zu stellen. RRB hat bereits zahlreiche Unternehmen beschleunigt, Pilotprojekte gesichert und Kundenverträge vermittelt, was zu erheblichen Finanzierungen geführt hat. Die Rose Rock Bridge Showcase ist ein Pitch-Wettbewerb, der sich auf die Kommerzialisierung und nicht nur auf die Finanzierung konzentriert, mit Industriepartnern wie Williams, ONEOK, Devon Energy und Helmerich and Payne. Ausgewählte Startups konkurrieren um Pilotmöglichkeiten und potenzielle Investitionen, wobei der Schwerpunkt auf Lösungen für Herausforderungen wie kohlenstoffarmes Erdgas liegt. Die Gewinner erhalten nicht verwässernde Finanzierungen, Unterstützungsleistungen und Pilotmöglichkeiten, um die Markteinführung zu beschleunigen. Die diesjährige Kohorte konzentriert sich auf Innovationen in Bereichen wie KI-gestützte chemische Analysen, Emissionsreduzierung, Abfallumwandlung und Roboterinspektion. Tulsa Innovation Labs unterstützt diese Unternehmen durch Laborräume, Forschungskooperationen, Finanzierungskontakte und Mentoring. RRB widmet sich dem "Polieren" von Startups und bereitet sie durch Pilotprogramme und Unterstützungsleistungen auf den Markteintritt vor.
CdXz5zHNQW_OpzZStVR80.jpeg
MIT-Forscher entwickelten SEAL, eine neuartige Technik, die es großen Sprachmodellen wie denen von ChatGPT ermöglicht, sich selbst zu verbessern. SEAL ermöglicht es LLMs, synthetische Daten zu generieren und ihre eigenen Fine-Tuning-Strategien zu formulieren, wodurch eine Selbstadaption erreicht wird. Diese Methode ist im Gegensatz zu herkömmlichen Modellen nicht ausschließlich auf externe Daten und von Menschen erstellte Prozesse angewiesen. Das erweiterte Papier und der letzten Monat veröffentlichte Open-Source-Code haben in der KI-Community große Aufmerksamkeit erregt. SEAL ist mit zwei Schleifen aufgebaut: Eine innere Schleife führt ein Fine-Tuning mit selbstgenerierten Bearbeitungen durch, und eine äußere Schleife verwendet Reinforcement Learning, um die Bearbeitungsgenerierungsrichtlinie zu optimieren. Die Leistung wurde anhand von Aufgaben zur Wissensaufnahme und zum Few-Shot-Learning bewertet, wobei signifikante Verbesserungen in der Genauigkeit festgestellt wurden. Die Technologie hilft Modellen, Wissen vor der Assimilation neu zu strukturieren, ähnlich wie menschliche Lernprozesse. Trotz starker Ergebnisse umfassen die Herausforderungen potenzielles katastrophales Vergessen und Rechenaufwand während des Fine-Tunings. Dennoch ist SEALs Fähigkeit, Trainingsdaten mit hohem Nutzen zu erstellen und über verschiedene Szenarien hinweg zu generalisieren, vielversprechend. Die Forscher sehen Anwendungen im Selbst-Pretraining und in der Entwicklung von agentenorientierteren KI-Systemen. Diese Arbeit stellt einen Schritt in Richtung einer autonomen LLM-Entwicklung dar, der möglicherweise Datenbeschränkungen angeht und zu Verbesserungen führt.
CdXz5zHNQW_YBrQHHj9O8.png
Unternehmen stehen oft vor einem Problem, wenn sie große Sprachmodelle (LLMs) feinabstimmen, bei dem die Modelle zuvor erlernte Fähigkeiten verlieren, ein Phänomen, das als katastrophales Vergessen bekannt ist. Forscher der University of Illinois Urbana-Champaign haben eine neue Methode vorgeschlagen, um dies zu vermeiden, indem sie sich auf die Neuausbildung nur schmaler Teile des LLM konzentrieren. Dieser Ansatz zielt darauf ab, die Rechenkosten zu senken und das vorhandene Wissen des Modells zu erhalten. Das Team geht davon aus, dass katastrophales Vergessen kein echter Gedächtnisverlust, sondern eine Nebenwirkung der Bias-Drift ist. Sie untersuchten dies, indem sie zwei Vision-Language-LLMs, LLaVA und Qwen 2.5-VL, für bestimmte Aufgaben trainierten und ihre Leistung an zurückgehaltenen Benchmarks beobachteten. Überraschenderweise stellten sie fest, dass die Feinabstimmung nur der Self-Attention-Projektionsschichten zum Erlernen neuer Aufgaben führte, ohne dass die Leistung bei bestehenden Aufgaben abfiel. Die Forschung deutet darauf hin, dass die Feinabstimmung des Multi-Layer-Perzeptrons (MLP) zu Output-Bias und vorübergehendem Vergessen führen kann. Durch selektives Feinabstimmen bestimmter MLP-Komponenten bei gleichzeitiger Einfrierung anderer erreichten sie effektives Lernen mit minimalem Vergessen. Diese schmale Neuausbildungsmethode bietet eine kostengünstigere und kontrollierbarere Möglichkeit, LLMs zu aktualisieren. Während sich die aktuelle Forschung auf Vision-Language-Modelle beschränkt, wird erwartet, dass die Ergebnisse auf andere LLMs über verschiedene Modalitäten hinweg anwendbar sind.
CdXz5zHNQW_ErvqWM29Xr.png
CdXz5zHNQW_BgoeY8QHcg.webp
"Salesforce startet Agentforce 360 auf der Dreamforce, mit Fokus auf KI-Agenten, um Geschäftsprozesse zu revolutionieren. Diese Initiative zielt darauf ab, Unternehmen in "Agenten-Unternehmen" zu verwandeln, bei denen KI bis zu 40 % der Arbeit neben Menschen übernimmt. Der Schritt adressiert das branchenweite Problem, dass die meisten Unternehmens-KI-Projekte vor der Produktion stagnieren. Salesforces Lösung integriert Agentforce 360, Data 360, Customer 360-Apps und Slack als primäre Benutzeroberfläche. Slack wird zum zentralen Hub für Salesforce-Funktionen und ersetzt traditionelle Dashboards durch konversationale Interaktionen. Die Plattform umfasst KI-Agenten für Vertrieb, IT, HR und Analytics sowie einen neu gestalteten Slackbot. Das Unternehmen expandiert auch in sprachbasierte Interaktionen und Mitarbeiter-IT-Service und fordert damit ServiceNow direkt heraus. Frühe Anwender berichten über signifikante Effizienzgewinne, mit Verbesserungen bei der Lösungszeit, Kosteneinsparungen und Fallabweisung. Salesforce betont die "Vertrauensschicht" mit Audit-Trails und Compliance, um das Verhalten von Agenten zu überwachen. Data 360 verbessert die Datenzugänglichkeit durch KI und Salesforce arbeitet mit verschiedenen Unternehmen an der Standardisierung zusammen. Die Initiative steht im Wettbewerb mit anderen Technologie-Giganten, die in KI investieren. Salesforce ist der Meinung, dass die Differenzierung in der Integration von KI mit Geschäftsprozessen und Daten für die Benutzerfreundlichkeit liegt. Während die Erfolgsgeschichten der Kunden vielversprechend sind, ist die Akzeptanz noch im Entwicklungsstadium und der Aktienkurs deutet auf anhaltende Skepsis der Anleger hin. Die Dreamforce wird entscheidend dafür sein, ob Salesforce die Unternehmens-KI-Adoption wesentlich skalieren kann."
CdXz5zHNQW_6R9jiLIrcx.webp
CdXz5zHNQW_Baj9HN4qBo.png
CdXz5zHNQW_RTrJdA5uEl.png
ScottsMiracle-Gro, ein hundertjähriges Gartenbauunternehmen, nutzt künstliche Intelligenz, um sich einen erheblichen Wettbewerbsvorteil zu verschaffen. Ursprünglich stützte sich das Unternehmen bei der Bestandsverwaltung auf manuelle Methoden, ist aber inzwischen dazu übergegangen, Drohnen und KI für präzise Volumenberechnungen einzusetzen. Dieser Wandel signalisiert eine umfassendere technologische Transformation, die die Erwartungen an eine KI-Führerschaft, die von traditionellen Konsumgüterunternehmen ausgeht, widerlegt. Unter der Leitung des Halbleiter-Veteranen Nate Baxter hat ScottsMiracle-Gro durch die Implementierung von KI erhebliche Einsparungen erzielt und den Kundenservice verbessert. Baxter erkannte Parallelen zwischen der Halbleiterherstellung und den Abläufen des Unternehmens und erkannte das ungenutzte Potenzial in seinem umfangreichen Gartenbauwissen. Er erklärte ScottsMiracle-Gro zu einem Technologieunternehmen und leitete eine organisatorische Umstrukturierung ein, in die IT-, Supply-Chain- und Markenteams integriert wurden. Das Unternehmen führte eine umfassende Datendigitalisierung und KI-Modellentwicklung durch, einschließlich der Erstellung spezialisierter Agenten, um die Produktnuancen zu verstehen. Diese KI-Integration erstreckt sich auf die Bedarfsprognose, die Bestandsverwaltung mit Drohnen und die Kundendienstleistungen und ermöglicht eine schnelle Umschichtung von Ressourcen auf der Grundlage von Predictive Analytics. Der Erfolg von ScottsMiracle-Gro unterstreicht die Leistungsfähigkeit der Kombination von allgemeiner KI mit proprietärem Domänenwissen und stellt traditionelle Branchenannahmen in Frage. Zu den Zukunftsplänen des Unternehmens gehören eine "Garten-Sommelier"-App und die Agent-zu-Agent-Kommunikation mit Einzelhandelspartnern. Diese Transformation bietet einen Fahrplan für traditionelle Unternehmen, um KI für geschäftliche Notwendigkeiten zu nutzen und das vorhandene Wissen zu einem strategischen Unterscheidungsmerkmal zu machen.
CdXz5zHNQW_wubKoMK3T8.png
Cyberkriminelle und staatliche Akteure setzen KI ein, um Systemschwachstellen innerhalb von drei Tagen auszunutzen – ein rasantes Tempo, das herkömmliche manuelle Patching-Methoden übertrifft. Anbieter gestalten ihre Sicherheitsinfrastruktur von Grund auf neu, um dieser Bedrohung entgegenzuwirken. Ivanti's neue Connect Secure Version 25.X, basierend auf gehärtetem Oracle Linux mit SELinux, demonstriert diesen Wandel hin zu fortschrittlicher Sicherheit auf Kernel-Ebene. Forscher haben die Realität dieser Ausnutzungsrisiken nachgewiesen und Authentifizierungs-Bypässe in wichtigen Sicherheitsprodukten aufgezeigt. Die Kompromittierung des Kernels verschafft Angreifern die vollständige Kontrolle über ein Gerät und damit über ein ganzes Netzwerk, wobei alle anderen Sicherheitsebenen umgangen werden. Ivanti's Ansatz umfasst Maßnahmen wie Secure Boot, Festplattenverschlüsselung und einen modernen sicheren Webserver zur Abwehr von Bedrohungen. Über die Kernel-Sicherheit hinaus bieten aufkommende Technologien wie eBPF verbesserte Transparenz und Sicherheit, ohne sich ausschließlich auf Kernel-Agenten zu verlassen. Gestaffeltes, automatisiertes Patching durch "Ring Deployment" ist ebenfalls entscheidend, um die Geschwindigkeitskrise im Schwachstellenmanagement zu bewältigen. Organisationen müssen die Automatisierung von Patches, die Überprüfung der Sicherheit auf Kernel-Ebene und die Schichtung von Abwehrmaßnahmen priorisieren, um ihre Angriffsfläche zu verringern. Transparenz von Anbietern in Bezug auf Sicherheitsvorfälle wird ebenfalls immer wichtiger. Letztendlich ist die Transformation auf Kernel-Ebene für das Überleben in einer Ära KI-gesteuerter Cyberangriffe unerlässlich.
CdXz5zHNQW_CSkk4sTJEU.jpeg
Unternehmen, die KI einsetzen, stoßen auf Leistungsgrenzen aufgrund statischer Spekulanten, die sich nicht an sich entwickelnde Workloads anpassen können. Diese Spekulanten arbeiten mit großen Sprachmodellen zusammen, um im Voraus mehrere Token zu entwerfen, was die Inferenzgeschwindigkeit erheblich verbessert und die Kosten senkt. Together AI hat ATLAS eingeführt, ein neues System mit adaptivem Lernen zur Inferenzoptimierung, das eine bis zu 400 % schnellere Leistung verspricht. Statische Spekulanten, die auf festen Datensätzen trainiert werden, verlieren an Genauigkeit, wenn sich die KI-Nutzungsmuster ändern, was zu einer verschlechterten Inferenzgeschwindigkeit führt. ATLAS verwendet eine Dual-Spekulanten-Architektur mit einem stabilen statischen Modell und einem leichten adaptiven Modell, das aus Live-Traffic lernt. Ein konfidenzbewusster Controller wählt dynamisch den geeigneten Spekulanten aus und ermöglicht so eine dynamische Anpassung des Spekulations-Lookaheads. Dieser adaptive Ansatz bietet eine Leistung, die mit spezialisierter Hardware wie kundenspezifischen Chips vergleichbar ist, und erreicht hohe Token-Generierungsraten. Die Leistungssteigerungen ergeben sich aus einer besseren Auslastung der Rechenkapazität durch den Austausch von Leerlaufverarbeitung gegen reduzierten Speicherzugriff. ATLAS funktioniert wie eine intelligente Caching-Schicht, die Muster lernt, anstatt exakte Antworten zu speichern. Anwendungsfälle umfassen das Training von Reinforcement Learning und die Anpassung an sich ändernde Enterprise-KI-Anwendungen. ATLAS ist jetzt auf der Plattform von Together AI ohne zusätzliche Kosten verfügbar, was auf einen breiteren Branchenwandel hin zu kontinuierlich lernenden Inferenzsystemen hindeutet.
CdXz5zHNQW_iLEz2YDwJK.jpeg
Raindrop, ein Startup für die Beobachtung von KI-Anwendungen, hat "Experiments" eingeführt, eine A/B-Test-Suite, die speziell für KI-Agenten in Unternehmen entwickelt wurde. Diese neue Funktion ermöglicht es Unternehmen, die Leistung verschiedener KI-Agenten zu vergleichen, basierend auf Änderungen in den zugrunde liegenden Modellen, Anweisungen und dem Zugriff auf Tools. Experiments erweitert die bestehenden Tools von Raindrop und bietet Einblicke in das Verhalten und die Entwicklung von KI-Agenten in realen Benutzerinteraktionen. Die Plattform verfolgt die Auswirkungen von Änderungen auf die KI-Leistung über Millionen von Interaktionen hinweg, visualisiert Ergebnisse und hebt sowohl positive als auch negative Signale hervor. Dieses Tool zielt darauf ab, die Strenge der modernen Softwarebereitstellung auf die Iteration von KI-Agenten zu übertragen und datengestützte Verbesserungen zu fördern. Die Kernaufgabe von Raindrop war es, das "Black-Box-Problem" in der KI anzugehen und Teams dabei zu helfen, zu verstehen, warum und wie ihre KI-Systeme versagen. Experiments geht das häufige Problem "Evaluierungen bestehen, Agenten scheitern" an, indem es sich auf das reale Verhalten der Agenten konzentriert. Die Plattform bietet leicht verständliche Daten, die Entwicklern helfen, Probleme wie Aufgabenfehler oder unerwartete Fehler schnell zu identifizieren und zu beheben. Experiments lässt sich in Feature-Flag-Plattformen und bestehende Analyse-Pipelines integrieren und gewährleistet so genaue Vergleiche mit ausreichenden Benutzerdaten. Raindrop bietet umfassende Datensicherheit, einschließlich Optionen zur Schwärzung von PII und SOC 2-Konformität, sowie verschiedene Preispläne. Das Unternehmen betont die kontinuierliche Verbesserung und zielt darauf ab, Entwicklern zu helfen, sich schneller zu bewegen und besser performende KI-Modelle auszuliefern, indem es reale Benutzerdaten priorisiert.
CdXz5zHNQW_gsijoDfwgk.png
Forscher bei Nvidia haben eine neue Technik namens Reinforcement Learning Pre-training entwickelt, die Reinforcement Learning in die anfängliche Trainingsphase großer Sprachmodelle integriert. Dieser Ansatz ermutigt das Modell, unabhängig zu denken, bevor es vorhersagt, was als Nächstes kommt, und lehrt es, auf einfachem Text zu schlussfolgern, ohne externe Verifizierer zu benötigen. Der typische Trainingszyklus für große Sprachmodelle umfasst das Vortraining auf riesigen Textmengen mit dem Ziel der Vorhersage des nächsten Tokens, gefolgt von einer Nachschulungsphase, in der sie komplexe Schlussfolgerungsfähigkeiten erlernen. Dieser sequentielle Prozess entspricht jedoch nicht dem menschlichen Verständnis, das eine parallele Integration von Eingaben mit Vorwissen darstellt. Die neue Technik, RLP, formuliert den Vortrainingsprozess neu, indem sie die Generierung von Gedankengängen als eine Aktion behandelt, die das Modell ausführt, bevor es das nächste Token vorhersagt. Das Modell erhält eine Belohnung basierend darauf, wie sehr sein Gedanke die Genauigkeit seiner Vorhersage verbessert hat, wodurch externe Verifizierer oder von Menschen gekennzeichnete Daten überflüssig werden. RLP hat signifikante Verbesserungen beim Erlernen komplexer Schlussfolgerungsaufgaben gezeigt, wobei Modelle, die mit dieser Technik trainiert wurden, ihre konventionell trainierten Gegenstücke durchweg übertreffen. Die Vorteile von RLP verstärken sich während nachfolgender Feinabstimmungsphasen, anstatt zu verschwinden, und die Technik zeigt eine beeindruckende Skalierbarkeit und Vielseitigkeit. Die Forscher glauben, dass RLP auf eine Zukunft hindeutet, in der das Vortraining kein monolithischer Prozess der Vorhersage des nächsten Tokens mehr ist, sondern vielmehr eine hybride Kombination von Zielen, die KI schafft, die von Anfang an robuster lernt zu denken. Insgesamt hat RLP das Potenzial, die Art und Weise, wie große Sprachmodelle trainiert werden, zu revolutionieren und ihnen zu ermöglichen, bereits zu Beginn des Trainings tiefere, strukturiertere Denkfähigkeiten zu entwickeln.
CdXz5zHNQW_Vkfqey1VGn.webp
Die Entwicklerkonferenz von OpenAI präsentierte aufregende KI-Fortschritte, aber die Veröffentlichung von Codex, ihrem KI-Softwareentwickler, war wohl die wichtigste Ankündigung. Codex, jetzt allgemein verfügbar, wurde entwickelt, um Tools zu erstellen, was die Strategie von OpenAI zur Dominanz des Unternehmensmarktes demonstriert. Diese Veröffentlichung umfasst ein neues SDK, Slack-Integration und Sicherheitskontrollen, was seine Bereitschaft für kritische Unternehmensaufgaben signalisiert. Angetrieben von GPT-5-Codex ermöglicht das KI-Modell autonomes Programmieren und bietet erhebliche Produktivitätssteigerungen, einschließlich der Erledigung langwieriger komplexer Aufgaben. OpenAI-Ingenieure nutzen Codex täglich, was zu einem Anstieg der wöchentlichen Code-Beiträge um 70 % führt und seine Kernrolle unterstreicht. Codex ist grundlegend für den Aufbau der anderen KI-Produkte von OpenAI, einschließlich der auf der Konferenz vorgestellten benutzerdefinierten Tools. Ein wichtiges Merkmal ist seine Code-Review-Funktion, die täglich Hunderte von Fehlern aufdeckt und Zeit spart. OpenAI priorisiert die Gewinnung von Unternehmenskunden mit Codex, wie CEO Sam Altman hervorhob. Unternehmen wie Cisco profitieren bereits von Codex, mit schnellerer Code-Überprüfung und Projektzeitplänen. Das neue SDK ermöglicht es Unternehmen, Codex in benutzerdefinierte Workflows zu integrieren und sich selbst entwickelnde Anwendungen zu erstellen. Während andere Ankündigungen die Aufmerksamkeit der Öffentlichkeit auf sich zogen, stellt Codex eine spürbare Veränderung in der Softwareentwicklung dar.
CdXz5zHNQW_MNllv1dkpu.webp
Professionelle Dienstleistungsunternehmen haben Schwierigkeiten, die Nachfrage aufgrund begrenzter menschlicher Kapazität zu befriedigen. Herkömmliche Professional Services Automation (PSA)-Software hat Einschränkungen. Autonome PSA, unterstützt durch KI-Agenten, bietet eine neue Lösung. Dieses Modell verbindet menschliches Fachwissen mit digitaler Arbeit und zentraler Orchestrierung und erweitert die Möglichkeiten der Leistungserbringung. Im Gegensatz zur Automatisierung konzentriert sich die Autonomie auf die zielorientierte Ausführung, was für komplexe Service-Operationen entscheidend ist. Autonome PSA adressiert die Komplexität von Geschäftsmodellen für professionelle Dienstleistungen und erschließt erhebliches Umsatzpotenzial. Salesforce bietet eine einheitliche Plattform für autonome PSA, die Kundendaten, KI-Agenten und eine native PSA-Lösung integriert. Die Orchestrierungs-Engine verwaltet eine hybride Belegschaft und verbessert die Personaleinsatzplanung und Projektergebnisse. Dieses System ermöglicht es Unternehmen, die Pipeline-Erfassung zu erhöhen, die Rentabilität zu verbessern und Projektzeitpläne zu beschleunigen. Die Vorbereitung auf autonome PSA beinhaltet die Neugestaltung der Belegschaft, die Investition in eine native Orchestrierungs-Engine und das Experimentieren mit Automatisierung. Die potenzielle Marktchance ist beträchtlich, mit erheblichen Umsatzsteigerungen. Unternehmen, die autonome PSA einführen, können mehr Nachfrage erfassen, Ergebnisse verbessern und den Kundenerfolg steigern. Der Wandel hin zu autonomen professionellen Dienstleistungen vollzieht sich jetzt, und die Orchestrierungs-Engine ist der Schlüssel zum Erfolg.
CdXz5zHNQW_KJPJdfYPUJ.jpeg
CdXz5zHNQW_ZJJLTb0fIz.png
CdXz5zHNQW_1rTnrgkqAP.png
Ein neuer G2-Bericht zeigt, dass KI-Agenten weitaus erfolgreicher sind als bisher angenommen, wobei fast 60 % der Unternehmen sie in der Produktion einsetzen und weniger als 2 % scheitern. Diese Daten widersprechen früheren akademischen Berichten, die eine weitverbreitete Stagnation von KI-Projekten nahelegen. Der Bericht befragte über 1.300 B2B-Entscheidungsträger und hob hohe Zufriedenheitsraten und erhebliche Kosteneinsparungen hervor, insbesondere im Kundenservice, in der BI und in der Softwareentwicklung. Trotz des Erfolgs besteht ein "totes Rennen" zwischen autonomen und hybriden Modellen, wobei Unternehmen häufig menschliche Aufsicht ausbalancieren. Volle Autonomie wird in risikofreien Arbeitsabläufen, wie z. B. der Datenverwaltung, eher akzeptiert. Unternehmen investieren auch stark in KI-Agenten, wobei die Mehrheit plant, die Investitionen im nächsten Jahr zu erhöhen. Agentforce, ein Salesforce-Produkt, ist marktführend, aber viele wollen eigene Tools entwickeln. KI-Agenten verbessern die Effizienz, indem sie menschliche Herausforderungen wie Aufschieberitis überwinden und schnellere Arbeitsabläufe mit konstanter Arbeit ermöglichen. Sicherheit ist ein zentrales Anliegen, da fast 40 % Sicherheitsvorfälle meldeten. Erklärbarkeit ist der Schlüssel zum Aufbau von Vertrauen und zur Konzentration auf Geschäftsprobleme vor der Implementierung. Vertrauen in KI, wie z. B. Cloud Computing, ist ein allmählicher Prozess, der offene Kommunikation und Daten erfordert. Unternehmen müssen die Messung und schnelle Nachschulung nach Fehlern von Agenten priorisieren. Daher kann ein korrekter Ansatz bei der Bereitstellung und die Minderung potenzieller Vertrauensprobleme zum Erfolg führen.
CdXz5zHNQW_mol982FVCh.png
Das Model Context Protocol (MCP), das anfangs für seine rasche Akzeptanz als KI-Integrationsstandard gelobt wurde, ist aufgrund seines Designs zu einer großen Cybersicherheitslücke geworden. Pynts Forschung zeigt einen gefährlichen Netzwerkeffekt: Je mehr MCP-Plugins verwendet werden, desto exponentiell größer ist das Risiko der Ausnutzung. Reibungslose Konnektivität, die Hauptstärke von MCP, förderte einen Mangel an Sicherheit, wobei die Authentifizierung anfangs optional war und Autorisierungs-Updates verspätet eintrafen. Dies hat zu einer wachsenden Angriffsfläche geführt, in der Verbindungen Schwachstellen verstärken und ein Lieferkettenrisiko schaffen. Forscher haben reale Exploits identifiziert, darunter Befehlsausführung und Datenexfiltration, was die Schwere des Problems unterstreicht. Das Fehlen von integrierter Sicherheit ermöglicht es Angreifern, KI-Assistenten potenziell durch kompromittierte Tools zu kontrollieren. Ein erheblicher Teil der eingesetzten MCP-Server ist anfällig und verfügt nicht über eine ordnungsgemäße Authentifizierung und Autorisierung. Eine mehrschichtige Verteidigungsstrategie, einschließlich Gateways, semantischer Schichten und Wissensgraphen, ist entscheidend für die Risikominderung. Sicherheitsverantwortlichen wird empfohlen, Gateways, mehrschichtige Sicherheit, regelmäßige Audits zu implementieren und die Plugin-Nutzung zu begrenzen. Investitionen in KI-spezifische Sicherheit sind unerlässlich, um dieses neu auftretende Risiko zu bewältigen.
CdXz5zHNQW_WNggKLLHjV.jpeg
ReasoningBank ist ein neues Framework, das Large Language Model (LLM)-Agenten befähigt, durch die Organisation von Erfahrungen in einer Speicherbank zu lernen und sich zu verbessern. Dieses Framework destilliert generalisierbare Denkstrategien aus erfolgreichen und erfolglosen Versuchen, Probleme zu lösen. Der Agent verwendet diesen Speicher während der Inferenz, vermeidet frühere Fehler und trifft bessere Entscheidungen bei neuen Aufgaben. ReasoningBank übertrifft traditionelle Speichermechanismen in Web-Browsing- und Software-Engineering-Benchmarks. Aktuelle LLM-Agenten lernen oft nicht aus gesammelten Erfahrungen, wiederholen Fehler und verpassen wertvolle Erkenntnisse. ReasoningBank begegnet diesem Problem, indem es jede Aufgabenerfahrung in wiederverwendbaren Denk-Speicher umwandelt. Dies ermöglicht es Agenten, bewährte Strategien aus früheren, ähnlichen Fällen anzupassen. Das Framework verwendet ein LLM-as-a-Judge-Schema, um Erfolg und Misserfolg zu beurteilen, wodurch menschliche Kennzeichnung überflüssig wird. Agenten rufen relevante Erinnerungen ab, um Aktionen zu steuern, indem sie den Speicher in ihren Denkprozess integrieren. Memory-aware Test-Time Scaling (MaTTS) verbessert die Leistung durch die Integration von Skalierung mit ReasoningBank. MaTTS integriert parallele und sequentielle Skalierung und steigert die Leistung weiter. ReasoningBank zeigte verbesserte Erfolgsraten und reduzierte Interaktionsschritte bei Web-Browsing-Aufgaben. Es hat einen direkten Einfluss auf die Betriebskosten, insbesondere durch die Eliminierung von Versuch und Irrtum. ReasoningBank bietet einen praktischen Weg zum Aufbau adaptiver und lebenslang lernender Agenten für Unternehmen und Anwendungen.
CdXz5zHNQW_AsGWTGL8tp.jpeg
Notion hat seine Produktivitätssoftware für Version 3.0 von Grund auf neu aufgebaut, um agentenbasierte KI im Unternehmensmaßstab zu unterstützen. Dieser Wandel ging über herkömmliche, schrittweise KI-Workflows hinaus zu fortschrittlichen Reasoning-Modellen, die in der Lage sind, autonom zu planen und Werkzeuge auszuführen. Die neue Architektur ermöglicht es KI-Agenten, Werkzeuge in vernetzten Umgebungen unabhängig auszuwählen, zu orchestrieren und auszuführen. Dies steht im Gegensatz zu älteren Methoden, die eine erschöpfende Aufforderung für bestimmte Aufgaben erforderten. Notions Ansatz nutzt modulare Sub-Agenten, die kontextbezogen suchen, Datenbanken abfragen und Inhalte bearbeiten. Das Unternehmen priorisiert eine "bessere, schnellere, günstigere" Philosophie und gleicht Latenz und Genauigkeit durch strenge Bewertungsrahmen aus. Dies beinhaltet die Identifizierung und Isolierung von Halluzinationen durch die Aufteilung von Bewertungsprozessen. Notion versteht auch, dass Latenz subjektiv ist und von dem Bedarf des Benutzers nach sofortigen Antworten im Vergleich zu einer umfassenden Analyse abhängt. Das Unternehmen nutzt sein eigenes Produkt intensiv und generiert wertvolles Feedback, um sicherzustellen, dass sich die Modelle nicht verschlechtern. Notion rät anderen Unternehmen, neu aufzubauen, wenn sich grundlegende Fähigkeiten ändern, die Latenz kontextbezogen zu behandeln und die Ergebnisse auf vertrauenswürdige Daten zu stützen. Sie glauben daran, schwierige Entscheidungen zu treffen und an der Spitze der KI-Entwicklung zu bleiben, um optimale Kundenerlebnisse zu schaffen.
CdXz5zHNQW_VmuSSuHQ41.png
OpenAI-CEO Sam Altman und Sir Jony Ive, der legendäre Designer hinter Apples ikonischsten Produkten, führten ein Gespräch in Fort Mason, um ihre Zusammenarbeit beim Bau einer neuen Familie von KI-gestützten Geräten zu besprechen. Die Partnerschaft wurde durch OpenAIs Übernahme von Ives Hardware-Startup Io gefestigt, und die Diskussion konzentrierte sich auf die Philosophie und die Ambitionen hinter ihrer geheimen Zusammenarbeit. Ive artikulierte eine Vision, um unsere gestörte Beziehung zur Technologie zu reparieren, was seiner Meinung nach eine tiefgreifende und therapeutische Mission ist. Die Zusammenarbeit dauerte Jahre, aber der Start von ChatGPT lieferte einen plötzlichen und klärenden Zweck für Ives Designkollektiv LoveFrom nach Apple. Ive beschrieb den aktuellen Stand der Technik als zutiefst fehlerhaft und glaubt, dass KI die Lösung für dieses Problem sein kann, anstatt eine Erweiterung davon. Das Hauptziel der neuen Geräte ist das emotionale Wohlbefinden und nicht die Produktivität, und Ive möchte, dass die Werkzeuge die Menschen glücklich, erfüllt und weniger ängstlich machen. Das Projekt umfasst eine Familie von Geräten, die wahrscheinlich eine Abkehr von der bildschirmzentrierten Welt darstellen, in der wir leben. Berichten zufolge handelt es sich um ein handflächengroßes Gerät ohne Bildschirm, das sich auf Kameras und Mikrofone verlässt, um seine Umgebung wahrzunehmen. Ive argumentierte, dass es absurd wäre anzunehmen, dass die heutige KI-Technologie durch Produkte geliefert werden sollte, die Jahrzehnte alt sind, und das Ziel ist es, etwas zu schaffen, das sich völlig neu und dennoch völlig natürlich anfühlt. Das Gespräch endete ohne Produktvorstellung und hinterließ dem Publikum eher einen philosophischen als einen technischen Entwurf, und Ive setzt auf eine bildschirmlose Zukunft, die von der Intelligenz von OpenAI angetrieben wird, um die Menschen weniger ängstlich und menschlicher zu machen. Die zentrale Erzählung ist klar, denn Ive, der Designer, der einen Bildschirm in jede Tasche steckte, arbeitet nun auf eine Zukunft hin, in der Technologie intuitiver und weniger aufdringlich ist.
CdXz5zHNQW_pHpSd3oyj5.webp
CdXz5zHNQW_Gh4GwJzeNS.png
AI21 Labs stellt Jamba Reasoning 3B vor, ein "winziges" Open-Source-Modell, das für den Unternehmenseinsatz auf Geräten wie Laptops und Telefonen konzipiert wurde. Dieses Modell kann erweiterte Argumentationen, Code-Generierung und wahrheitsbasierte Antworten verarbeiten und über 250.000 Token handhaben. AI21 sieht kleine Modelle als entscheidend für Unternehmen an, da sie die Rechenzentrumslast reduzieren, indem sie die Inferenz auf Geräte verlagern und die teuren Rechenzentrumskosten senken. Jamba Reasoning 3B kombiniert Mamba und Transformer, was ein großes Kontextfenster und schnellere Inferenzgeschwindigkeiten ermöglicht, getestet mit 35 Token pro Sekunde auf einem MacBook Pro. Die Hybridarchitektur minimiert auch den Speicherbedarf und verbessert die Recheneffizienz. Das Modell zeichnet sich bei Aufgaben wie Funktionsaufrufen und richtlinienbasierten Generierungen aus und eignet sich somit für einfachere Anfragen. Die Leistung von Jamba Reasoning 3B übertrifft andere kleine Modelle in Benchmarks wie IFBench und Humanity's Last Exam. Im Vergleich zu anderen Modellen wie Qwen 4B und Llama 3.2B-3B bietet Jamba Reasoning 3B eine überlegene Steuerbarkeit und verbesserten Datenschutz für Unternehmen, da die Inferenz lokal bleibt. Unternehmen setzen zunehmend auf kleine Modelle, wobei Wettbewerber wie Meta, Google und FICO ebenfalls ihre eigenen fokussierten Modelle veröffentlichen. Der Co-CEO von AI21 ist der Ansicht, dass die Optimierung der Kundenerfahrung durch On-Device-Modelle zu einem Mainstream-Trend werden wird.
CdXz5zHNQW_IwOE2OHdnt.png
OpenAI-CEO Sam Altman enthüllte auf dem DevDay eine Vision, die digitale Welt über einfache Chatbots hinaus zu transformieren. Das Unternehmen entwickelt sich zu einer umfassenden Computerplattform, die von der Bereitstellung von Modellen zum Aufbau eines gesamten Ökosystems übergeht. ChatGPT wird als Plattform mit einem Apps SDK neu erfunden, das es Entwicklern ermöglicht, Anwendungen direkt in der Chat-Oberfläche zu erstellen und zu vertreiben. Diese Apps können interaktive und personalisierte Erlebnisse bieten und die riesige Nutzerbasis von OpenAI erreichen. Über ChatGPT hinaus stattet OpenAI KI-Agenten mit dem Agent Kit aus, das autonome KI-Arbeiter befähigt, komplexe Aufgaben und Geschäftsprozesse zu automatisieren. Das Unternehmen verbessert auch seinen KI-Codierungsagenten Codex, der von GPT-5 angetrieben wird und nun autonom Code schreiben, überprüfen und integrieren kann. Eine bedeutende, nicht angekündigte Zusammenarbeit mit dem legendären Designer Jony Ive wurde enthüllt, die sich auf die Entwicklung neuer KI-zentrierter Hardware konzentriert. Ive glaubt, dass aktuelle Produkte für fortgeschrittene KI unzureichend sind und zielt darauf ab, die Beziehung der Menschheit zur Technologie neu zu gestalten. Eine kritische Einschränkung für diese ehrgeizige Zukunft ist die massive Nachfrage nach Rechenleistung, die die erheblichen Infrastrukturinvestitionen von OpenAI vorantreibt. Das Unternehmen betrachtet KI als den zukünftigen grundlegenden Treiber des Wirtschaftswachstums. OpenAI schafft nicht nur KI; es baut die zukünftige Umgebung für KI, die intelligente Anwendungen, Agenten und Hardware umfasst.
CdXz5zHNQW_mgL0SyLweX.webp
Googles DeepMind hat Gemini 2.5 Pro Computer Use veröffentlicht, ein KI-Modell, das als virtueller Agent im Web fungieren soll. Dieses neue Modell kann Websites navigieren, Formulare ausfüllen und Aktionen im Namen von Benutzern ausführen, ähnlich wie Angebote von OpenAI und Anthropic. Googles CEO Sundar Pichai hob seine Bedeutung für die Entwicklung von Allzweck-KI-Agenten hervor. Obwohl es für Verbraucher nicht direkt verfügbar ist, ist es über die Browserbase-Plattform und die Gemini API für Entwickler zugänglich. Das Modell baut auf den Fähigkeiten von Gemini 2.5 Pro auf und konzentriert sich auf die Interaktion mit Benutzeroberflächen. Es ermöglicht KI-Systemen, visuell und funktional zu agieren, im Gegensatz zu API-abhängigen Modellen. Erste Tests zeigen Erfolge bei der Navigation auf Websites und der Erledigung von Aufgaben, obwohl es den direkten Dateisystemzugriff von Wettbewerbern vermissen lässt. Google behauptet, Gemini 2.5 Computer Use führe bei Benchmarks zur Steuerung von Benutzeroberflächen und biete eine geringere Latenz. Das Modell arbeitet in einer Interaktionsschleife, analysiert Screenshots und Benutzereingaben, um Aktionen zu empfehlen. Sicherheitsmaßnahmen umfassen eine schrittweise Überprüfung und vom Entwickler definierte Anweisungen. Es unterstützt verschiedene UI-Aktionen wie Klicken und Tippen mit normalisierten Bildschirmkoordinaten. Die Preisgestaltung ähnelt der von Gemini 2.5 Pro, aber Computer Use ist ausschließlich ein kostenpflichtiges Angebot. Daten aus der kostenpflichtigen Nutzung verbessern Google-Produkte nicht, im Gegensatz zur kostenlosen Version von Gemini 2.5 Pro.
CdXz5zHNQW_IjVm0ltTV5.png
Konversationelle KI hat seit langem menschenähnliche Assistenten versprochen, aber die zuverlässige Erledigung von Aufgaben außerhalb des Chats bleibt eine erhebliche Herausforderung, wobei selbst Spitzenmodelle bei Benchmarks häufig versagen. Das in New York ansässige Unternehmen Augmented Intelligence (AUI) Inc. glaubt, dass sein neues Basismodell Apollo-1 eine Lösung durch zustandsbasiertes neuro-symbolisches Reasoning bietet. Diese hybride Architektur zielt darauf ab, konsistente, richtlinienkonforme Ergebnisse zu gewährleisten, im Gegensatz zu rein generativen LLMs, die wahrscheinliche, aber keine sicheren Ergebnisse liefern. Während LLMs im offenen Dialog glänzen, ist Apollo-1 für aufgabenorientierte Konversationen konzipiert, die Sicherheit und vorhersehbares Verhalten erfordern. Der Ansatz von AUI beinhaltet eine geschlossene Reasoning-Schleife, die natürliche Sprache in einen symbolischen Zustand übersetzt, diesen beibehält und darauf agiert, um eine deterministische Aufgabenerfüllung zu erreichen. Apollo-1 ist als domänenunabhängiges Basismodell konzipiert, das über einen "Behavioral Contract" System Prompt konfiguriert werden kann. Das über acht Jahre entwickelte Modell trennt prozedurales und deskriptives Wissen von aufgabenorientierten Konversationen. Benchmarks zeigen, dass Apollo-1 bestehende LLMs bei der Aufgabenerfüllungsrate in verschiedenen Domänen signifikant übertrifft. AUI positioniert Apollo-1 als komplementären Gegenpart zu LLMs und vervollständigt das Spektrum der konversationellen KI. Das Modell befindet sich derzeit in begrenzten Pilotprojekten mit Fortune-500-Unternehmen und plant die allgemeine Veröffentlichung im November 2025 mit erweiterten Funktionen und API-Zugang. Das Kernversprechen von Apollo-1 ist es, KI zu schaffen, der Unternehmen vertrauen können, zuverlässig zu handeln und möglicherweise die Lücke zwischen Sprechen und Handeln zu schließen.
CdXz5zHNQW_nt2X1vTCyy.png
Unternehmen stehen vor Herausforderungen bei der vollständigen Einführung von Agenten-KI, und IBM ist der Ansicht, dass die Steuerung von KI-Agenten in der Produktion ein zentrales Hindernis darstellt. Auf seiner TechXchange 2025 Konferenz stellte IBM neue Funktionen vor, um diese Probleme anzugehen. Project Bob, eine KI-zentrierte IDE, zielt darauf ab, die Anwendungsmodernisierung durch die Orchestrierung mehrerer LLMs zu automatisieren. AgentOps bietet Echtzeit-Governance für KI-Agenten in Produktionsumgebungen. IBM integrierte auch das Open-Source-Tool Langflow in watsonx Orchestrate, seine Plattform für die Bereitstellung von KI-Agenten. Diese Strategie zielt auf die Modernisierung von Altsystemen, die Governance von KI-Agenten und die Überbrückung der Lücke zwischen KI-Prototypen und der Produktion ab. Project Bob hat bei IBM-Entwicklern intern zu erheblichen Produktivitätssteigerungen und einer Zunahme von Code-Commits geführt. Im Gegensatz zu allgemeinen Codierungswerkzeugen konzentriert sich Project Bob auf die Modernisierung von Unternehmen, die Aufrechterhaltung des Repository-Kontexts und die Automatisierung komplexer Upgrades. Es leitet Aufgaben intelligent an das beste LLM weiter, basierend auf Genauigkeit, Latenz und Kosten. Das Tool integriert DevSecOps-Praktiken und verbessert Sicherheit und Compliance direkt in der IDE. Eine neue Partnerschaft mit Anthropic integriert Claude-Modelle in watsonx und bietet eine Anleitung für die sichere Bereitstellung von KI-Agenten für Unternehmen. Die Integration von Langflow in watsonx Orchestrate zielt darauf ab, Open-Source-Prototyping in unternehmensgerechte Systeme mit zusätzlicher Governance und Skalierbarkeit zu verwandeln. AgentOps und Agentic Workflows verbessern watsonx Orchestrate weiter, indem sie standardisierte Agentenkoordination und Produktions-Governance bieten. Die Ankündigungen von IBM unterstreichen, dass eine Governance-Infrastruktur jetzt für die sichere und skalierbare Bereitstellung von KI-Agenten in Unternehmen unerlässlich ist.
CdXz5zHNQW_5QG6tSIjHf.png
OpenAI hat AgentKit gestartet, eine neue Plattform zur Vereinfachung der Agentenentwicklung für Unternehmen. Ziel ist es, die bisher über verschiedene Tools verteilten Entwicklungsbemühungen zu zentralisieren. AgentKit führt Agent Builder ein, eine visuelle Oberfläche zum Entwerfen und Versionieren von Multi-Agenten-Workflows. Es enthält auch ein Connector Registry zur Verwaltung von Verbindungen zu OpenAI-Produkten und Diensten von Drittanbietern. ChatKit ermöglicht die einfache Integration von Chat-Schnittstellen für diese Agenten. OpenAI erweitert auch die Fähigkeiten zur Agentenbewertung mit automatisierter Benotung und Prompt-Optimierung. Während einige Funktionen noch in der Beta-Phase sind, sind ChatKit und neue Bewertungstools allgemein verfügbar. Die Preisgestaltung für AgentKit wird in die bestehenden OpenAI API-Modelle integriert, wodurch mehr Unternehmen in das Ökosystem von OpenAI integriert werden. Die Plattform verspricht schnelle Iterationen und Transparenz der Agentenfunktionalität, wie ein Agent zur schnellen Agenda-Analyse zeigt. Konkurrenten wie Google und Microsoft bieten ebenfalls ähnliche Entwickler-Toolkits für den Agentenbau an. Frühe Anwender, wie das Fintech-Unternehmen Ramp, berichten von erheblichen Zeitersparnissen und verbesserter Zusammenarbeit. Connector Registry wird vorgefertigte Integrationen mit beliebten Plattformen wie Dropbox und Google Drive anbieten. Eine Sicherheitsfunktion namens Guardrails ist enthalten, um den Abfluss von PII und bösartiges Verhalten zu verhindern. ChatKit zielt darauf ab, den komplexen Prozess der Bereitstellung von Chat-UIs für Agenten zu vereinfachen. Während AgentKit den Bau vereinfacht, entfällt die Notwendigkeit technischer Expertise nicht, und einige sehen es als Ergänzung zu Plattformen wie Zapier.
CdXz5zHNQW_XZ1pBu5IjW.png
Die DevDay-Konferenz von OpenAI stellte ein innovatives Apps SDK vor, das es Drittanbietern ermöglicht, Anwendungen direkt in ChatGPT zu erstellen, einschließlich kostenpflichtiger Optionen. Diese neue Funktion erlaubt es Benutzern, nahtlos mit externen Apps und deren Daten zu interagieren, ohne die Chatbot-Oberfläche verlassen zu müssen. Benutzer können Apps wie Canva anweisen, Präsentationen zu erstellen, oder Zillow, um Häuser zu finden, alles über konversationelle Aufforderungen. Das Apps SDK basiert auf dem Open-Source-Standard Model Context Protocol, der zuvor von Anthropic eingeführt wurde. Es ermöglicht ChatGPT-Modellen den Zugriff auf Echtzeit-Kontexte aus diesen integrierten Apps. Entwickler können Apps erstellen, die als Karten, Karussells oder im Vollbild- und Bild-im-Bild-Modus angezeigt werden, wodurch der konversationelle Fluss von ChatGPT erhalten bleibt. Frühe Integrationen mit Coursera, Canva und Zillow zeigen das Potenzial für interaktives Lernen, Design und Immobilien-Browsing. Weitere Partner wie Booking.com, Expedia und Spotify integrieren ebenfalls ihre Dienste. Um Sicherheit und Datenschutz zu gewährleisten, müssen alle Apps strenge Richtlinien einhalten, einschließlich klarer Datenschutzrichtlinien und Benutzerzustimmung. OpenAI verwandelt ChatGPT durch die Förderung dieses App-Ökosystems in ein umfassendes KI-Betriebssystem. Dieser Schritt schafft neue Möglichkeiten für Entwickler und bietet Benutzern eine einheitliche konversationelle Schnittstelle für vielfältige Aufgaben. Fragen zur Datensicherheit und zur Zukunft des GPT Store von OpenAI bleiben jedoch bestehen.
CdXz5zHNQW_0txH2exhFQ.png
Die aktuelle kognitive Migration, angetrieben durch KI, bietet eine stark unterschiedliche Perspektive für den Globalen Norden und den Globalen Süden. Während westliche Volkswirtschaften, insbesondere die im Silicon Valley, die Fortschritte der KI mit Besorgnis hinsichtlich des Arbeitsplatzverlusts für Angestellte betrachten, sieht der Globale Süden darin eine transformative Chance für die Entwicklung. Daten zeigen eine signifikante Komfortlücke, wobei eine Mehrheit in Ländern wie Indien, Indonesien und Nigeria KI begrüßt, verglichen mit weniger als einem Drittel in den USA. Für den Globalen Süden verspricht KI Fortschritte in Bildung, Gesundheitswesen und Landwirtschaft und ermöglicht es ihnen, frühere industrielle Revolutionen zu überspringen. Diese optimistische Erzählung wird jedoch durch erhebliche Hindernisse wie Infrastrukturdefizite, Datenknappheit und einen Mangel an qualifizierten Fachkräften gedämpft. Trotz dieser Herausforderungen befeuert die Wahrnehmung von KI als Entwicklungswerkzeug und nicht als Bedrohung für etablierte Berufe das größere Vertrauen in diesen Regionen. Medienerzählungen verstärken diese Divergenz weiter, wobei westliche Medien sich auf Automatisierungsangst konzentrieren und südliche Medien das Potenzial der KI für Fortschritt hervorheben. Unter der Oberfläche dieser wahrgenommenen Unterschiede birgt die KI-Migration versteckte Kosten. Wesentliche, aber oft schlecht bezahlte Arbeiten wie die Datenannotation unterstützen die globale KI-Wirtschaft, während Sektoren wie Business Process Outsourcing von Automatisierungsbedrohungen betroffen sind. Dies wirft die Frage auf, ob KI eine einzige, einheitliche Migration oder mehrere, unterschiedliche Reisen schafft. Letztendlich ist die KI-Migration ein komplexes, verflochtenes Phänomen, kein singuläres Ereignis. Während sich die Erfahrungen des Globalen Nordens und Südens unterscheiden, gewinnen beide Aspekte ihrer bestehenden Strukturen und verlieren sie. Die Reise ist ungleichmäßig, mit unterschiedlichen Ausgangspunkten, Routen und Belastungen. Der Globale Süden betrachtet KI trotz struktureller Herausforderungen oft als Hebel für Fortschritt und bietet Modelle der Inklusion und des Vertrauens. Die entscheidende Erkenntnis ist, dass Anpassung Vorstellungskraft und die Anerkennung von Gewinnen und Verlusten erfordert. Das Ignorieren der Signale ungleichmäßigen Fortschritts und der Ausbeutung birgt die Gefahr, eine Zukunft zu schaffen, in der die Vorteile der KI auf eine ausgewählte Gruppe konzentriert sind. Daher ist die Gestaltung der KI-Entwicklung mit Inklusion und Vertrauen im Kern, unter Einbeziehung von Lehren aus vielfältigen globalen Erfahrungen, für eine gemeinsame menschliche Zukunft unerlässlich.
CdXz5zHNQW_Qn7nCgO4sX.jpeg
Cybersecurity-Bedrohungen haben aufgrund von KI in Umfang und Raffinesse dramatisch zugenommen und traditionelle Security Operations Center (SOCs) überfordert. Das alte Ticket-und-Untersuchungsmodell ist nicht mehr effektiv und erfordert mehr Analysten, als viele Organisationen unterstützen können. Um dem entgegenzuwirken, hat DXC Technology in Zusammenarbeit mit 7AI das DXC Agentic Security Operations Center gestartet. Dieses neue SOC integriert autonome KI-Agenten zur Bewältigung von Bedrohungs-Triage, Untersuchung und Reaktion in großem Maßstab. Tests im eigenen SOC von DXC zeigten signifikante Verbesserungen, darunter eine Reduzierung der Zeit für Tier-1-Analysten um 80 % und eine Verringerung der mittleren Reaktionszeit um 67 %. Dies stellt eine grundlegende Verschiebung von automatisierten Reaktionen hin zu adaptiver, kontextbezogener und durchgängiger agentenbasierter Sicherheit dar. Die KI-Agenten bewerten jeden Alarm einzigartig, lernen und passen sich aus vergangenen Vorfällen an. Das Agentic SOC von DXC eliminiert Engpässe bei der manuellen Verarbeitung und wird voraussichtlich die Untersuchungszeit pro Vorfall erheblich verkürzen. Während Organisationen bei der Einführung von KI auf emotionale und operative Hürden stoßen können, wird dies als wesentliche Entwicklung für das Überleben im Bereich Cybersicherheit dargestellt. Eine erfolgreiche Implementierung erfordert Sponsoring auf höchster Ebene und kann einfach als Erweiterung der Fähigkeiten menschlicher Analysten betrachtet werden.
CdXz5zHNQW_mHOXYQCS5M.png
CdXz5zHNQW_XoQRRo1jkl.png
Das traditionelle Von-Neumann- oder Harvard-Modell ist seit über einem halben Jahrhundert die Grundlage für fast jeden modernen Chip, einschließlich CPUs, GPUs und spezialisierte Beschleuniger. Ein neuer Ansatz namens Deterministische Ausführung stellt diesen Status quo jedoch in Frage, indem er jede Operation mit Präzision auf Zyklusebene plant und so einen vorhersehbaren Ausführungszeitplan erstellt. Dieser Ansatz ermöglicht es einem einzigen Prozessor, Skalar-, Vektor- und Matrix-Computing zu vereinheitlichen und sowohl allgemeine als auch KI-intensive Workloads zu bewältigen, ohne auf separate Beschleuniger angewiesen zu sein. Die deterministische Ausführung eliminiert Spekulationen vollständig, da jeder Befehl ein festes Zeitfenster und eine feste Ressourcenzuweisung hat, um sicherzustellen, dass er genau im richtigen Zyklus ausgegeben wird. Der Mechanismus dahinter ist eine Zeit-Ressourcen-Matrix, ein Planungs-Framework, das Rechen-, Speicher- und Steuerungsressourcen über die Zeit hinweg orchestriert. Dieser Ansatz adressiert die Herausforderungen von KI-Workloads in Unternehmen, die bestehende Architekturen an ihre Grenzen bringen, indem er eine einheitliche Architektur und vorhersehbare Leistung bietet. Die deterministische Ausführung reduziert auch den Stromverbrauch und den physischen Fußabdruck durch die Vereinfachung der Steuerungslogik, was sich in einer kleineren Chip-Fläche und einem geringeren Energieverbrauch niederschlägt. Zu den wichtigsten Innovationen der Architektur gehören die Zeit-Ressourcen-Matrix, Phantomregister, Vektordatenpuffer und Befehlswiedergabepuffer, die eine Rechen-Engine ermöglichen, die die Flexibilität einer CPU mit dem anhaltenden Durchsatz eines Beschleunigers kombiniert. Die deterministische Ausführung hat weitreichende Auswirkungen auf andere Bereiche, einschließlich sicherheitskritischer Systeme, Echtzeitanalysesysteme und Edge-Computing-Plattformen, wo sie deterministische Timing-Garantien bieten, die Verifizierung vereinfachen und die Energieeffizienz verbessern kann. Die Umstellung auf deterministische Ausführung stellt eine Rückkehr zur Einfachheit der Architektur dar, bei der ein Chip mehrere Rollen ohne Kompromisse erfüllen kann und das Potenzial hat, die Hardwarekomplexität zu reduzieren, die Energiekosten zu senken und die Softwarebereitstellung zu vereinfachen.
CdXz5zHNQW_rOnVCPJlCA.png
CdXz5zHNQW_3jaZcPehTf.webp
Eine neue Studie stellt LIMI vor, einen Rahmen, der zeigt, dass weniger Daten zu intelligenteren KI-Agenten führen können. Forscher fanden heraus, dass qualitativ hochwertige agentische Demonstrationen, nicht riesige Datensätze, der Schlüssel zur Entwicklung autonomer KI-Systeme sind. LIMIs Ansatz konzentriert sich auf die Kuratierung strategisch ausgewählter Beispiele für KI-Problemlösungen. Experimente zeigten, dass ein Modell, das auf nur 78 sorgfältig ausgewählten Demonstrationen trainiert wurde, Modelle, die auf Tausenden von Beispielen trainiert wurden, deutlich übertraf. Diese Entdeckung ist entscheidend für Unternehmensanwendungen, bei denen die Datenerfassung schwierig und teuer ist. Agentur wird als KI-Systeme definiert, die autonom Probleme erkennen, Hypothesen formulieren und Lösungen ausführen können. Das aktuelle Training von LLMs geht oft davon aus, dass mehr Daten gleichbedeutend mit höherer agentischer Intelligenz sind, was zu komplexen Pipelines und Ressourcenanforderungen führt. LIMIs Methode beinhaltet das Sammeln von Anfragen und detaillierten Verläufen von KI-Aktionen zur Lösung dieser Anfragen. Der Datensatz wurde anhand von realen Szenarien und synthetisierten Anfragen erstellt, die von menschlichen Experten geprüft wurden. Die Verläufe erfassten den gesamten Problemlösungsprozess, einschließlich Fehlern und Verfeinerungen. LIMI-trainierte Modelle erzielten überlegene Ergebnisse bei Benchmarks für agentische Fähigkeiten, Werkzeugnutzung und Codierung. Die Studie legt nahe, dass die Beherrschung der Agentur darin besteht, ihre Kernprinzipien zu verstehen, nicht nur die Datenskalierung. Dieser Rahmen bietet einen nachhaltigen Weg zur Entwicklung spezialisierter KI-Agenten für Unternehmen.
CdXz5zHNQW_yoQp2prh7q.jpeg
Google strebt eine tiefe Integration seines Coding-Assistenten Jules in die Arbeitsabläufe von Entwicklern an, die über reine Chat-Schnittstellen hinausgeht. Zwei neue Funktionen, eine Jules API und ein Jules Tools CLI, sollen diese Integration ermöglichen. Die API wird es Jules ermöglichen, sich mit IDEs zu verbinden, während das CLI die direkte Nutzung in der Kommandozeile ermöglicht. Dieser Schritt steht im Einklang mit einem breiteren Branchentrend, KI-Agenten in Anwendungen einzubetten, um den Benutzerkomfort zu erhöhen. Entwickler können nun direkt von ihren Terminals auf Jules zugreifen, was Aufgaben wie Testen, Erstellen und Debuggen erleichtert, ohne ihren Arbeitsablauf zu verlassen. Das CLI bietet die Installation über npm mit Befehlen zum Abfragen von Jules und zur Anpassung seines Verhaltens. Die API bietet Unternehmen mehr Flexibilität und ermöglicht die Integration mit Plattformen wie Slack, um Aufgaben direkt aus Nachrichten auszulösen. Diese Integration ermöglicht es Teammitgliedern, Aktionen wie Fehlerbehebungen direkt aus Slack zu initiieren, die dann mit ihren CI/CD-Pipelines interagieren. Google hat auch Updates implementiert, um die Latenz zu reduzieren und Umweltprobleme zu lösen. Diese Updates umfassen einen Dateiauswähler zum Hinzufügen von Kontext im Chat und eine Speicherfunktion zum Erinnern an Benutzereinstellungen. Die Verwaltung von Umgebungsvariablen wurde ebenfalls verbessert, wodurch Jules während der Aufgabenausführung Zugriff erhält. Insgesamt war die Reaktion auf diese Updates weitgehend positiv, obwohl einige Verwirrung bezüglich der verschiedenen Coding-Agenten-CLI-Angebote von Google besteht.
CdXz5zHNQW_rFAJmlGeLU.png
CdXz5zHNQW_Q97ejJIKBP.webp
IBM hat Granite 4.0 auf den Markt gebracht, eine neue Familie von Open-Source-Sprachmodellen, die für hohe Leistung und Effizienz entwickelt wurden. Mit dieser Veröffentlichung kehrt IBM in die wettbewerbsintensive Landschaft der Sprachmodelle zurück, insbesondere im Wettbewerb mit chinesischen Modellen wie Qwen von Alibaba. Granite 4.0 verwendet eine neuartige hybride Architektur, die Transformer- und Mamba-Designs kombiniert. Transformer sind hervorragend im Kontext, aber rechenintensiv, während Mamba für lange Sequenzen effizienter ist. Dieser hybride Ansatz zielt darauf ab, die Stärken beider zu nutzen und den GPU-Speicherverbrauch um über 70 % zu reduzieren. Die Modelle sind unter einer permissiven Apache 2.0-Lizenz verfügbar, was die kommerzielle Nutzung und Modifikationen fördert. Granite 4.0 zeigt eine starke Leistung bei Benchmarks für die Befolgung von Anweisungen und Funktionsaufrufe. IBM legt Wert auf Vertrauen und Sicherheit, wobei Granite die erste offene Modellfamilie ist, die nach ISO/IEC 42001 zertifiziert ist. Die Modelle werden auf einem riesigen Korpus von 22 Billionen Tokens trainiert, einschließlich unternehmensrelevanter Datensätze. IBM plant eine weitere Expansion mit zusätzlichen Modellen für verschiedene Unternehmensanforderungen. Granite 4.0-Modelle sind über Plattformen wie Hugging Face und IBM watsonx.ai zugänglich, wobei eine breitere Partnerunterstützung erwartet wird. Diese Veröffentlichung positioniert IBM als Anbieter von unternehmensgerechten, kostengünstigen und sicheren KI-Lösungen.
CdXz5zHNQW_HqCqdCGH6N.png
Die INBOUND-Konferenz von HubSpot in San Francisco konzentrierte sich auf Innovationen in den Bereichen Marketing, Vertrieb, CX und KI. HubSpot CTO Dharmesh Shah sprach über die zweischneidige Natur der KI als exponentielle Chance und existenzielle Bedrohung. Er betonte die Zusammenarbeit mit KI anstatt des Wettbewerbs gegen sie und sah sie als Werkzeug mit immensen Vorhersagefähigkeiten. Shah hob hervor, dass die Lernkurve der KI im Vergleich zu ihrem exponentiellen Fähigkeitswachstum linear sei. Er verglich generative KI damit, Tausende von Doktortiteln in der Tasche zu haben, was kreative und weitreichende Aufgaben ermöglicht. Er wies jedoch auf KI-Einschränkungen hin, wie die Abhängigkeit von Trainingsdaten und gelegentliche Halluzinationen. Shah gab den Tipp, KI für jede Computeraufgabe auszuprobieren und Misserfolge als vorübergehende Rückschläge zu betrachten. Er betonte die Bedeutung des Prompt Engineering, einschließlich der Qualität des Prompts, der Wahl des Modells und des Kontexts. Über Prompts hinaus verbessert das Context Engineering mit benutzerdefinierten Anweisungen die KI-Ergebnisse erheblich. Shah erklärte, dass dies das Jahrzehnt der KI-Agenten sei, nicht nur das Jahr, und Millionen bereits Plattformen wie Agent.ai nutzen. Er schlug die TEAM-Strategie für die Einführung von KI in Teams vor: Triage, Experimentieren, Automatisieren und Messen. Letztendlich gewinnen die Menschen mit ihrem emotionalen Quotient und verschmelzen gelebte Erfahrung mit KI für erweiterte Intelligenz. KI soll repetitive Aufgaben übernehmen, damit sich Menschen auf bemerkenswertere und freudigere Arbeit konzentrieren können.
CdXz5zHNQW_epiXUZ71ro.png
CdXz5zHNQW_YLXs2aqiCT.png
Unternehmen nutzen oft teure ETL-Pipelines, um operative PostgreSQL-Daten für Analysen oder KI zu verschieben, was zu Verzögerungen führt und dedizierte Ingenieurteams erfordert. Dieser traditionelle Ansatz reicht für das schnelle Tempo der Entwicklung von KI-Agenten-gesteuerten Anwendungen nicht aus. Databricks übernimmt Mooncake, um ETL-Pipelines zu eliminieren, indem operative Daten sofort für Analysen und KI verfügbar gemacht werden. Die Technologie von Mooncake ermöglicht es, analytische Workloads direkt auf PostgreSQL auszuführen und bietet Echtzeit-Transformationen in spaltenorientierte Formate ohne traditionelles ETL. Diese Integration wird voraussichtlich die Leistung des Datentransfers um das 10- bis 100-fache verbessern. Die Dringlichkeit dieser Übernahme wird durch die steigende Anzahl von Datenbanken, die von KI-Agenten erstellt werden, unterstrichen. Der Ansatz von Mooncake vereinfacht den Datenzugriff für Agenten und ermöglicht schnellere Iterationen. Die Strategie von Databricks positioniert das Unternehmen gegenüber den verwalteten PostgreSQL-Angeboten von Cloud-Anbietern wie Googles AlloyDB und Amazons Aurora, wobei integrierte operative und analytische Modelle betont werden. Diese Übernahme zielt darauf ab, Ingenieurressourcen freizusetzen, indem die Verwaltung der Dateninfrastruktur vereinfacht und die schnellere Bereitstellung von KI-gesteuerten Anwendungen ermöglicht wird. Letztendlich ermöglicht dies Entwicklungsteams den Zugriff auf operative Daten für Analysen und KI ohne Engpässe im Data Engineering.
CdXz5zHNQW_tNN5kVF2B8.jpeg
Unternehmensabschlüsse für KI-Codierungstools werden nicht durch Geschwindigkeit gewonnen, sondern durch Sicherheit, Compliance und Bereitstellungskontrolle. Diese Diskrepanz zwischen der Präferenz der Entwickler für Geschwindigkeit und den Anforderungen der Käufer gestaltet den Markt neu und führt zu einer langsameren Einführung der schnellsten Tools. Compliance-Anforderungen schließen viele schnelle KI-Codierungstools systematisch von der Betrachtung durch Unternehmen aus. GitHub Copilot führt die Einführung in Unternehmen aufgrund seiner Ökosystemintegration an, während Anthropic's Claude Code für seine Bereitstellungsflexibilität und Sicherheitsfunktionen beliebt ist. Dieser Kompromiss zwingt Unternehmen zu kostspieligen Multi-Plattform-Strategien, wobei fast die Hälfte mehr als ein KI-Codierungstool nutzt. Größere Unternehmen priorisieren Sicherheit als größte Hürde für die Einführung, während kleinere Teams den Return on Investment in Frage stellen. Praktische Tests, die Unternehmensanforderungen simulierten, zeigten, dass der methodische Ansatz von Claude Code, obwohl langsamer, kostspielige Implementierungsfehler verhinderte. Nur Claude Code warnte vor der Weitergabe von Geheimnissen, eine entscheidende Compliance-Überlegung für regulierte Branchen. Cloud-only-Plattformen werden ebenfalls von Organisationen ausgeschlossen, die Air-Gap-Bereitstellungsoptionen benötigen. Die tatsächlichen Gesamtkosten für KI-Codierungstools übersteigen die veröffentlichten Preise erheblich und erfordern oft Dual-Plattform-Strategien, die die Ausgaben verdoppeln. Trotz dieser Kosten zeigen erfolgreiche Implementierungen erhebliche Einsparungen für Entwickler und eine verbesserte Geschwindigkeit bei der Bereitstellung von Funktionen, was die Investition rechtfertigt.
Slack führt neue Plattformfunktionen ein, die KI-Agenten direkten Zugriff auf seine riesigen Konversationsdaten in Arbeitsplatzkanälen ermöglichen. Dieser Schritt zielt darauf ab, KI-Agenten relevanter und nützlicher zu machen, indem sie in Echtzeit-Diskussionen, Entscheidungen und institutionelles Wissen eingebettet werden. Slacks Ansatz positioniert das Unternehmen als grundlegende Schicht für KI, anstatt isolierte Funktionen zu entwickeln. Die Echtzeit-Such-API und der Model Context Protocol-Server ermöglichen einen sicheren, berechtigungsbewussten Zugriff auf Nachrichten und Dateien von Slack. Dies löst ein Kernproblem bei der Entwicklung von KI-Agenten: ihre Integration in den tatsächlichen Arbeitsablauf. Führende KI-Unternehmen wie Anthropic und Google bauen bereits auf diesen neuen Funktionen von Slack auf. Slacks Sicherheitsarchitektur stellt sicher, dass KI-Agenten nur autorisierte Informationen über authentifizierte Benutzeranmeldeinformationen abrufen. Das Unternehmen hat auch vertraglich die Nutzung von API-Antworten für das Training von KI-Modellen Dritter untersagt. Diese Strategie konkurriert direkt mit Microsoft Teams, das KI ebenfalls über seine Copilot-Plattform integriert. Slack konzentriert sich darauf, ein Integrations-Hub zu werden, die Benutzerbindung und -bindung zu fördern, ohne direkte Gebühren für KI-Entwickler zu erheben. Dieser Ansatz zielt darauf ab, Slack zum zentralen Nervensystem für Unternehmensarbeit zu machen und höhere Abonnementpreise zu rechtfertigen. Die Vision ist, dass KI-Agenten als konversationelle Teamkollegen innerhalb von Slack fungieren, die Kosten für Kontextwechsel reduzieren und den Zugriff auf informelle Entscheidungsdaten ermöglichen. Slack hat eine Infrastruktur aufgebaut, um Echtzeit-KI-Anfragen effizient zu bearbeiten und schnelle und gezielte Antworten zu gewährleisten. Der Erfolg dieser Strategie hängt davon ab, dass Unternehmen konversationelle KI als natürliche Erweiterung der Teamkommunikation akzeptieren.
CdXz5zHNQW_tyajYhtMZu.webp
Thinking Machines, ein KI-Startup, das von der ehemaligen OpenAI-CTO Mira Murati gegründet wurde, hat Tinker auf den Markt gebracht, sein erstes Produkt zur Vereinfachung des Fine-Tunings von Large Language Models (LLMs). Tinker ist eine Python-basierte API, die Entwicklern eine detaillierte Kontrolle über Trainingspipelines bietet und gleichzeitig die verteilte Recheninfrastruktur verwaltet. Dies ermöglicht es Forschern, sich auf das experimentelle Design und die Entwicklung benutzerdefinierter Modelle zu konzentrieren, ohne sich um Infrastrukturprobleme kümmern zu müssen. Das Tool bietet native Python-Primitive, unterstützt verschiedene Open-Weight-Modelle, einschließlich Mixture-of-Experts, und integriert sich für Kosteneffizienz in das LoRA-basierte Tuning. Tinker enthält auch eine Open-Source-Begleitbibliothek, das Tinker Cookbook. Forscher von Institutionen wie Princeton und Stanford haben Tinker bereits für Aufgaben wie formale Theorembeweise und chemisches Schlussfolgern eingesetzt und signifikante Leistungsverbesserungen erzielt. Die KI-Forschungsgemeinschaft hat Tinker für seinen entwicklerzentrierten Ansatz gelobt, der die algorithmische Kontrolle von der Infrastrukturverwaltung trennt. Andrej Karpathy hob das clevere Design von Tinker hervor, das es den Benutzern ermöglicht, die algorithmische Kontrolle zu behalten und gleichzeitig die Komplexität der Infrastruktur auszulagern. John Schulman beschrieb Tinker als die Infrastruktur, die er sich immer gewünscht hat, und ermöglicht leistungsstarke Operationen ohne ständige manuelle Überwachung. Tinker befindet sich derzeit in der privaten Beta-Phase und wird bald ein Pay-as-you-go-Preismodell einführen. Thinking Machines, das 2 Milliarden US-Dollar eingesammelt hat, zielt darauf ab, die offene und anpassbare KI-Entwicklung zu unterstützen und sich durch den Fokus auf multimodale KI-Systeme, die mit Benutzern zusammenarbeiten, zu differenzieren.
CdXz5zHNQW_MzfP74f9Mr.png