2025-03-03 04:00 PM UTC+9:00

Claude 3.7 Sonet veröffentlicht: ChatGPT ist jetzt Goodbye!

vvd.im/claude-37-sonet
Liste
https://vvd.im/claude-37-sonet
Anthropic hat Claude Sonnet 3.7, das neueste und fortschrittlichste KI-Modell, veröffentlicht.

Diese neue Version führt bahnbrechende Funktionen ein, die die Inferenzfähigkeiten, die Kodierfähigkeiten und die Benutzerinteraktion verbessern.
Mit hybrider Inferenz, verbesserter Unterstützung für die Softwareentwicklung und Kommandozeilen-Tools für die Kodierung von Agenten wird Claude Sonet 3.7 die KI-gestützten Arbeitsabläufe neu definieren.
Claude 3.7 Sonet veröffentlicht: ChatGPT ist jetzt Goodbye!

Claude 3.7 Sonet wurde am 25. Februar 2025 veröffentlicht.

Claude 3.7 Sonnet ist jetzt für alle Kunden mit einem kostenpflichtigen Copilot-Tarif verfügbar. Dieses neue Sonnet-Modell unterstützt sowohl denkende als auch nicht denkende Modi von Copilot. Erste Tests haben besonders starke Verbesserungen in Agentenszenarien gezeigt.
In unserer internen Evaluierung auf GitHub zeigte das Modell Verbesserungen gegenüber den Vorgängermodellen in Bezug auf seine Fähigkeit, Anweisungen zu befolgen, komplexe Aufgaben aufzuschlüsseln und neue menschliche Bewertungen (UIs) zu erstellen.

Wir haben Sonnet 3.5 und 3.6 monatelang verwendet, um den Code mehrerer Java- und JavaScript-basierter Projekte zu verbessern, und 3.7 lieferte sofort besser aussehenden, moderneren und verbesserten Code.

Zuvor lieferte es kleine Codeschnipsel mit kürzeren Antworten, und wir wurden ständig daran erinnert, vollständigen Code, längere Antworten, keine fehlenden Antworten usw. zu liefern. Die Antworten von 3.7 führten uns durch die Ordnerstruktur, die Installation von Abhängigkeiten, die anfängliche Projekteinrichtung und die Erstellung von Bibliotheken, und dann funktioniert es mit jeder unserer JSX-Seiten, jede mit Tausenden von Codezeilen, und es funktioniert ohne Fehler oder Probleme mit Referenzen oder Bibliotheken.

Wenn Sie kein Entwickler sind, keine Angst, es dauert jetzt weniger als 3 Minuten, um eine schöne Website mit richtigem CSS, Animationen, Farben und einer modernen Benutzeroberfläche zu erstellen.

Dieser Artikel wurde auf der Grundlage eines ursprünglich auf der Anthropic-Website veröffentlichten Artikels neu verfasst.

Um den zuvor geschriebenen Artikel über "ChatGPT vs. Claude" zu lesen, klicken Sie hier.

 

Claude-Code

Claude 3.7 Sonnet ist ein großer Schritt nach vorne, vor allem für die Programmierung und Front-End-Web-Entwicklung. Zusammen mit diesem Modell führen wir auch Claude Code ein, ein Kommandozeilentool für Coding Agents. Claude Code ist als begrenzte Forschungsvorschau verfügbar und ermöglicht es Entwicklern, wichtige technische Aufgaben direkt vom Terminal aus an Claude zu delegieren. Claude Code ist als begrenzte Forschungsvorschau verfügbar und ermöglicht es Entwicklern, wichtige technische Aufgaben direkt vom Terminal aus an Claude zu delegieren.

Claude 3.7 Sonnet ist jetzt für alle Claude-Tarife - Free, Pro, Team und Enterprise - sowie für die Anthropic API, Amazon Bedrock und Vertex AI auf Google Cloud verfügbar. Erweiterte Denkmodi sind für alle Tarife außer dem kostenlosen Claude-Tier verfügbar.

Sowohl für die Standard- als auch für die erweiterten Denkmodi gelten für Claude 3.7 Sonnet die gleichen Preise wie für die Vorgängerversionen: $3 pro 1 Million Eingabetoken und $15 pro 1 Million Ausgabetoken (einschließlich Ereignis-Token).

Claude 3.7 Sonnet: Grenzüberschreitendes Denken in der Praxis

Bei der Entwicklung von Claude 3.7 Sonnet verfolgte Claude eine andere Philosophie als andere Inferenzmodelle auf dem Markt: So wie der Mensch ein Gehirn für schnelle Reaktionen und ein anderes für tiefes Nachdenken nutzt, sind wir der Meinung, dass die Inferenz eine integrierte Funktion des Frontier-Modells sein sollte und nicht ein völlig separates Modell.

Claude 3.7 Sonnet setzt diese Philosophie auf verschiedene Weise um.

  • Erstens verfügt Claude 3.7 Sonnet sowohl über die Funktionalität eines regulären LLM als auch über die eines Inferenzmodells. Sie können wählen, wann Sie möchten, dass das Modell normal antwortet und wann es länger nachdenken soll, bevor es antwortet. Im Standardmodus ist Claude 3.7 Sonnet eine verbesserte Version von Claude 3.5 Sonnet. Im erweiterten Denkmodus können Sie in Mathematik, Physik, beim Befolgen von Anweisungen, beim Programmieren und bei vielen anderen Aufgaben besser abschneiden, weil Sie vor der Antwort nachdenken. Im Allgemeinen funktionieren die Aufforderungen für Modelle in beiden Modi ähnlich.
     
  • Zweitens können die Benutzer bei der Verwendung von Claude 3.7 Sonnet über die API das Budget für ihr Denken steuern: Sie können Claude anweisen, N Token nicht zu überschreiten, wobei N ein beliebiger Wert bis zur Ausgabegrenze von 128.000 Token sein kann. Auf diese Weise können Sie Geschwindigkeit und Kosten gegen die Qualität der Antworten abwägen.
     
  • Drittens haben wir bei der Entwicklung des Inferenzmodells nicht so sehr für Mathematik- und Informatik-Wettbewerbsfragen optimiert, sondern uns auf reale Aufgaben konzentriert, die besser widerspiegeln, wie Unternehmen LLMs tatsächlich einsetzen.

    Die ersten Tests zeigten, dass Claudes Programmierfähigkeiten im Allgemeinen gut waren. Cursor bestätigte, dass Claude bei realen Programmieraufgaben wieder an der Spitze seines Könnens stand und deutliche Verbesserungen in Bereichen zeigte, die von der Handhabung komplexer Codebasen bis zur Verwendung fortgeschrittener Tools reichten. Cognition stellte fest, dass Claude allen anderen Modellen in Bezug auf die Planung von Codeänderungen und die Handhabung von Full-Stack-Updates weit überlegen war; Vercel hob die überragende Genauigkeit von Claude bei komplexen Agenten-Workflows hervor; und Replit setzte Claude erfolgreich dort ein, wo andere Modelle ins Stocken gerieten, nämlich bei der Erstellung anspruchsvoller Webanwendungen und Dashboards von Grund auf. Bei der Bewertung durch Canva produzierte Claude durchweg produktionsreifen Code mit großem Design-Flair und einer drastischen Fehlerreduzierung.

SWE-Bench Verifiziert

Claude 3.7 Sonnet erreichte die beste Leistung im SWE-Bench Verified, der die Fähigkeit von KI-Modellen bewertet, reale Softwareprobleme zu lösen.

TAU-Bank

Claude 3.7 Sonnet erreicht die beste Leistung bei TAU-bench, einem Framework zum Testen von KI-Agenten bei komplexen realen Aufgaben mit Benutzer- und Werkzeuginteraktion.

Claude 3.7 Sonnet

Claude 3.7 Sonnet zeichnet sich durch das Befolgen von Anweisungen, allgemeines logisches Denken, multimodale Fähigkeiten und Agentencodierung aus, während das erweiterte Denken bemerkenswerte Fortschritte in Mathematik und Naturwissenschaften liefert. Über die traditionellen Benchmarks hinaus übertraf es alle früheren Modelle beim Playtest von Pokémon-Spielen.

Der Claude-Code

Seit Juni 2024 hat sich Sonnet zum bevorzugten Modell für Entwickler auf der ganzen Welt entwickelt. Um Entwicklern noch mehr Möglichkeiten zu bieten, haben wir Claude Code, unser erstes Agenten-Coding-Tool, als begrenzte Forschungsvorschau veröffentlicht.
Claude Code ist ein aktives Kollaborationstool, mit dem Sie Code suchen und lesen, Dateien bearbeiten, Tests schreiben und ausführen, Code auf GitHub übertragen und veröffentlichen sowie Befehlszeilentools verwenden können.

Claude Code ist ein frühes Produkt, aber es wird unentbehrlich werden, insbesondere für die testgetriebene Entwicklung, das Debuggen komplexer Probleme und das Refactoring in großem Maßstab.

In ersten Tests hat Claude Code die Entwicklungszeit und den Overhead reduziert, indem es Aufgaben in einem Durchgang erledigt, die normalerweise 45 Minuten oder mehr an manueller Arbeit erfordern würden.
In den kommenden Wochen werden weitere Verbesserungen auf der Grundlage der Nutzung vorgenommen (Verbesserung der Zuverlässigkeit von Toolaufrufen, Hinzufügen von Unterstützung für langlaufende Befehle, Verbesserung des In-App-Renderings und Erweiterung des eigenen Verständnisses der Fähigkeiten von Claude).

Das Ziel von Claude Code ist es, besser zu verstehen, wie Entwickler Claude zum Programmieren verwenden, um so zukünftige Verbesserungen des Modells zu ermöglichen.

Verfügbarkeit und Preise

Für Entwickler, die mit Claude 3.7 Sonnet benutzerdefinierte KI-Lösungen erstellen möchten, ist es über die Anthropic API, Amazon Bedrock und Vertex AI auf Google Cloud verfügbar.

Für Geschäfts- und Privatanwender, die mit Claude 3.7 Sonnet über ein einfaches Chat-Erlebnis zusammenarbeiten möchten, ist Claude 3.7 Sonnet auf Claude.ai für alle Benutzer auf Web, iOS und Android verfügbar.

Die Preise für Claude 3.7 Sonnet beginnen bei 3 $ pro 1 Million Input-Token und 15 $ pro 1 Million Output-Token, mit Einsparungen von bis zu 90 % bei sofortiger Zwischenspeicherung und 50 % bei Stapelverarbeitung. Weitere Einzelheiten finden Sie auf unserer Preisseite.

Arbeiten an Ihrer Codebasis mit Claude

Wir haben auch die Coding-Erfahrung auf Claude.ai verbessert: Die GitHub-Integration ist jetzt für alle Claude-Tarife verfügbar. Entwickler können ihre Code-Repositories direkt mit Claude verbinden.

Claude 3.7 Sonnet ist das beste Kodierungsmodell, das je entwickelt wurde. Da es sein Verständnis für persönliche, professionelle und Open-Source-Projekte vertieft, wird es ein noch stärkerer Partner bei der Fehlerbehebung, der Entwicklung von Funktionen und der Dokumentation für Ihre wichtigsten GitHub-Projekte sein.

Verantwortungsvolle Entwicklung

Claude hat in Zusammenarbeit mit externen Experten umfangreiche Tests und Bewertungen von Claude 3.7 Sonnet durchgeführt, um sicherzustellen, dass es den Sicherheits- und Zuverlässigkeitsstandards entspricht. Claude 3.7 Sonnet unterscheidet außerdem feiner zwischen schädlichen und harmlosen Anfragen, was zu 45 % weniger unnötigen Ablehnungen führt als frühere Versionen. Claude 3.7 Sonnet unterscheidet außerdem feiner zwischen schädlichen und harmlosen Anfragen, was zu 45 % weniger unnötigen Ablehnungen führt als frühere Versionen.

Die Systemkarte umfasst neue Sicherheitsergebnisse in mehreren Kategorien und bietet eine detaillierte Analyse der verantwortungsvollen Bewertung der Skalierungspolitik, die andere KI-Labors und Forscher auf ihre Arbeit anwenden können. Die Karte befasst sich auch mit neuen Risiken im Zusammenhang mit der Computernutzung, insbesondere mit Prompt-Injection-Angriffen, und beschreibt, wie wir diese Schwachstellen bewertet und Claude darauf trainiert haben, ihnen zu widerstehen und sie zu entschärfen. Wir untersuchen auch die potenziellen Sicherheitsvorteile von Inferenzmodellen, nämlich die Möglichkeit zu verstehen, wie ein Modell Entscheidungen trifft und ob seine Schlussfolgerungen wirklich vertrauenswürdig und zuverlässig sind.

Ein Blick in die Zukunft

Claude 3.7 Sonet und Claude sind ein wichtiger Schritt auf dem Weg zu KI-Systemen, die die menschlichen Fähigkeiten wirklich ergänzen können. Mit ihrer Fähigkeit, tiefgründig zu denken, autonom zu arbeiten und effektiv zusammenzuarbeiten, bringen sie uns einer Zukunft näher, in der KI das, was Menschen leisten können, bereichert und erweitert.

Die Zukunft von Claude AI

Ich freue mich darauf, die neuen Möglichkeiten zu erforschen und zu sehen, was wir mit ihnen schaffen können. Claude ist immer auf der Suche nach Feedback vonNutzern, um das Modell weiter zu verbessern und weiterzuentwickeln.

Ich danke Ihnen.

Liste


JaeDeok Park
Qualitätsmanager
JaeDeok Park ist Qualitätsmanager bei Vivoldi und arbeitet daran, Probleme der Nutzer zu lösen und einen hervorragenden Service zu bieten.
In seiner Freizeit liest er gerne Bücher und geht gelegentlich gerne shoppen.