Skip to main content

Verbessern der Agentqualität zur Optimierung der KI-Nutzung

Lernen Sie Strategien zum Erstellen höherer Agenten, die Aufgaben in weniger Versuchen ausführen und daher weniger AI creditsverwenden.

Einleitung

Wenn Agents klar abgegrenzt, klar instruiert und innerhalb klarer Leitplanken eingesetzt werden, verbessert sich die Tokeneffizienz ganz natürlich. Hochwertige Agents führen Aufgaben in weniger Versuchen aus, folgen klareren Workflows mit weniger Überarbeitungen und vermeiden teure Debugging- und Korrekturzyklen.

Befolgen Sie die in diesem Artikel beschriebenen Strategien, um sowohl die Qualität der Agenten als AI credits auch die Effizienz zu verbessern.

1. Wählen Sie das richtige Modell für die richtige Aufgabe aus.

Die Wahl des Modells ist einer der schnellsten Wege, sowohl die Qualität der Agenten als auch die Kosteneffizienz zu verbessern, wird jedoch oft übersehen. Ein gängiges Muster besteht darin, für jede Aufgabe standardmäßig das fähigste Modell zu verwenden. Dies erhöht jedoch häufig die Tokennutzung, ohne das Ergebnis zu verbessern. In einigen Szenarien mit ausführungsintensiven Szenarien können überlastende Begründungsmodelle die Qualität verringern, da das Modell die Aufgabe möglicherweise überdenken oder unnötige Änderungen verursachen kann.

Wählen Sie das Modell basierend auf der beteiligten Arbeit aus:

  • Begründungsmodelle: Am besten geeignet für Architekturentscheidungen, komplexes Debuggen, Systemdesign und Aufgaben, die eine tiefere Analyse erfordern.
  • Modelle der mittleren Leistungsklasse: Am besten geeignet, wenn der Plan bereits klar ist und der Agent effizient handeln muss.
  • Leichtere Modelle: Am besten geeignet für Umgestaltung, Formatierung, Dokumentationsaktualisierungen und andere routinebezogene Änderungen.

Verwenden Sie so viele Funktionen wie die Aufgabe und so wenig wie nötig. Die Zuordnung der richtigen Fähigkeiten zu den jeweiligen Aufgaben verbessert die Ergebnisse und hält die Kosten bei großem Umfang direkt unter Kontrolle.

Eine Aufschlüsselung nach Modell und Vorgangstyp finden Sie unter Vergleichen von KI-Modellen bei Verwendung unterschiedlicher Aufgaben.

Konfigurieren der Begründungsebene des Modells

Einige Modelle unterstützen auch konfigurierbare Denkstufen, die steuern, wie intensiv das Modell nachdenkt, bevor es antwortet. Eine höhere Ebene kann Antworten auf komplexe Probleme verbessern, aber es verbraucht mehr Token und daher mehr Gutschriften, daher sollten Sie die normale Ebene standardmäßig verwenden und es nur für schwierigere Aufgaben erhöhen. Konfigurierbare Gründe stehen für Visual Studio Code und Copilot CLI für unterstützte Modelle zur Verfügung.

Siehe Unterstützte KI-Modelle in GitHub Copilot.

Copilot Automatische Modellauswahl verwenden

Copilot Automatische Modellauswahl wählt ein fähiges Modell für Sie aus, basierend auf der Absicht Ihrer Aufgabe.

Siehe Über CopilotAutomatische Modellauswahl.

2. Stellen Sie klare Anleitungen in Ihren Eingabeaufforderungen bereit.

Ihre Eingabeaufforderung legt die Richtung für alles fest, was der Agent tut. Wenn eine Eingabeaufforderung vage ist, muss der Agent die Absicht ableiten, mehr Kontext erkunden und Urteilsaufrufe tätigen. Das führt häufig zu erneuten Versuchen, einer schleichenden Ausweitung des Umfangs und unnötigem Tokenverbrauch.

Gut strukturierte Eingabeaufforderungen haben drei Qualitäten:

  • Eine klare Aufgabendefinition. Statt „Beheben Sie dieses Problem“ zu schreiben, erklären Sie, worin das Problem besteht, wo es auftritt und wie das erwartete Ergebnis aussieht.
  • Relevanter Kontext vorab bereitgestellt. Wenn Sie bereits wissen, welche Dateien, Dienste, Protokolle, Fehler oder Eingaben wichtig sind, fügen Sie sie ein. Dies hilft dem Agenten, unnötige Erkundungen zu vermeiden.
  • Eine klare Beendigungsbedingung. Teilen Sie dem Agent mit, wie "erledigt" aussieht. Ohne einen klaren Endpunkt können Agenten über das Ziel hinausschießen, indem sie zusätzliche Commits hinzufügen, nicht zusammenhängenden Code refaktorieren oder den Umfang erweitern.

Diese hinzugefügte Anleitung erhöht die Tokennutzung nicht sinnvoll, kann aber die Anzahl der Agentausführungen erheblich reduzieren, die erforderlich sind, um das richtige Ergebnis zu erreichen.

Bewährte Methoden für das Prompt Engineering finden Sie unter Prompt-Engineering für GitHub Copilot Chat.

3. Halten Sie Ihren Kontext knapp

Copilot sendet den Kontext, auf den es Zugriff hat, als Eingabetokens, und dieser Kontext summiert sich: Geöffnete Tabs im Editor, angehängte Dateien und der vollständige Hin-und-Her-Verlauf einer langen Unterhaltung zählen allesamt als Kontext.

Gehen Sie wie folgt vor, um den Kontext unter Kontrolle zu halten:

Starten Sie eine neue Unterhaltung, wenn Sie zu einem anderen Problem wechseln.

Ein langer Thread trägt seinen gesamten Verlauf in jede neue Anforderung. Wenn Sie zu einer nicht verknüpften Aufgabe wechseln, beginnen Sie eine neue Unterhaltung. Beispiel:

  • Verwenden Sie in Copilot CLI/new (oder /clear)
  • Starten Sie eine neue Chatsitzung in Copilot-Chat.

Lange Copilot CLI Sitzungen komprimieren, die Sie fortsetzen möchten

Wenn der Thread weiterlaufen soll, aber zu groß geworden ist, führen Sie /compact in Copilot CLI aus, um den Verlauf zusammenzufassen und das Kontextfenster zu verkleinern, wobei Sie die Zusammenfassung optional fokussieren können (zum Beispiel /compact focus on the auth module).

Darüber hinaus können Sie /context verwenden, um die aktuelle Nutzung jederzeit zu überprüfen.

Siehe Verwalten des Kontexts in GitHub Copilot-CLI.

Geben Sie Copilot eine Karte Ihres Projekts

Eine gut gepflegte datei mit benutzerdefinierten Anweisungen, z. B. eine AGENTS.md Datei, .github/copilot-instructions.md bietet Agents einen strukturellen Überblick über Ihr Repository, damit sie keine große Anzahl von Dateien lesen müssen, um sich zu orientieren. Siehe Unterstützung für verschiedene Arten von benutzerdefinierten Anweisungen.

Bringen Sie nur die benötigten Tools ein

Große Werkzeugsammlungen (zum Beispiel so viele Tools wie auf einem vollständigen MCP-Server) erweitern bei jeder Anfrage den Kontext. Wo sie ihrem Workflow entspricht, aktivieren Sie nur die Toolsets, die für die Aufgabe relevant sind.

Siehe Konfigurieren von Toolsets für den GitHub MCP-Server.

Nutzen Sie die Vorteile der Kontextzwischenspeicherung

Copilot greift dank Caching wieder auf Kontext zurück, den Sie bereits gesendet haben, wodurch die Kosten für Folgeinteraktionen sinken. Zwischengespeicherter Kontext läuft jedoch nach einem Zeitraum der Inaktivität ab und wird nicht wiederverwendet, wenn Sie die Modelle in der Mitte der Sitzung wechseln. In beiden Fällen wird der Kontext erneut gesendet und erneut als neue Eingabe-Token berechnet. Um das Beste aus der Zwischenspeicherung herauszuholen, führen Sie zusammengehörige Arbeiten in einer durchgehenden Sitzung durch und vermeiden Sie einen Modellwechsel mitten in der Sitzung.

4. Reduzieren wiederholter Fehler mit einer copilot-instructions.md Datei

Dauerhafte Anweisungen verbessern die Konsistenz zwischen Agentinteraktionen, aber ihr Wert hängt vollständig davon ab, wie sie geschrieben werden. Eine copilot-instructions.md Datei auf Repositoryebene ist die direkteste Methode zum Codieren dieser Anleitung. Persönliche Anweisungen und Anweisungen auf Organisationsebene können zusätzlich angewendet werden, um eine übergreifende Konsistenz zu gewährleisten.

Die besten Anweisungen sind kurz, spezifisch und in echtem Verhalten des Agenten verankert – nicht generische bewährte Methoden, die gut klingen, aber nicht auf Ihr System angewendet werden.

Was sie enthalten soll:

  • Erforderliche Frameworks, Bibliotheken oder Entwurfsmuster
  • Bekannte Fallstricke, die der Agent häufig wiederholt
  • Erwartungen an die Ausgabe wie „fassen Sie sich kurz“ oder „nur Code ausgeben“
  • Teamspezifische Konventionen, die der Agent befolgen muss
  • Erstellen, Testen und Lint-Befehle

Was zu vermeiden ist:

  • Lange, generische Dokumentation
  • KI-generierte Anleitungen, die Ihr tatsächliches System nicht widerspiegeln
  • Einmalige Einstellungen oder selten verwendete Details
  • Überladene Anweisungen, die den Kontext laut machen

Halten Sie Anweisungen auf dem neuesten Stand, während Ihre Codebasis, Architektur, Standards und Workflows weiterentwickelt werden. Da diese Anweisungen bei jeder Ausführung im Kontext des Agenten enthalten sind, können selbst kleine Verbesserungen wiederkehrende Fehler verringern und den unnötigen Tokenverbrauch im Laufe der Zeit senken.

Weitere Informationen findest du unter Hinzufügen von benutzerdefinierten Repositoryanweisungen für GitHub Copilot.

5. Forschung, Planung und Umsetzung

Eine der größten Veränderungen bei der effektiven Arbeit mit Agenten besteht darin, nicht mehr alles in einer einzigen Sitzung zu erledigen. Wenn Forschung, Planung und Implementierung zusammen stattfinden, wächst der Kontext schnell, irrelevante Informationen sammeln sich an und die Agentqualität verschlechtert sich im Laufe der Zeit.

Teilen Sie die Arbeit in klare Phasen ein:

  • Forschung: Verwenden Sie den Agent, um die Codebasis zu erkunden, relevante Dateien zu identifizieren und Abhängigkeiten zu verstehen.
  • Plan: Erstellen Sie einen detaillierten, strukturierten Plan oder eine Spezifikation, bevor Sie Änderungen vornehmen. Hier sind Reasoning-Modelle am wertvollsten.
    • Verwenden Sie in Copilot CLI/plan.
    • In Copilot-Chat in Visual Studio Code wählen Sie „Plan“ aus dem Agent-Dropdown-Menü aus oder geben plan in das Kontextfenster ein.
  • Implementieren: Den Plan mit fokussiertem Kontext und einem für die Umsetzung geeigneten Modell ausführen.

Das Starten einer neuen Sitzung zwischen den Phasen verhindert, dass unnötiger Kontext mitgeschleppt wird. Die Weiterführung des Kontexts aus früheren Phasen kann die Tokennutzung erhöhen, Verzerrungen einführen und Klarheit für den Agent reduzieren. Jede Phase sollte nur mit dem funktionieren, was sie benötigt. Anleitung zur effektiven Durchführung von Scoping-Sitzungen finden Sie unter Bewährte Methoden für die Verwendung von GitHub Copilot für die Arbeit an Vorgängen.

6. Deterministische Leitplanken hinzufügen

Agents sind nicht deterministisch und werden nicht jedes Mal korrekt sein, insbesondere in mehrstufigen Workflows. Ohne Leitplanken können sich kleine Fehler schnell summieren: Agenten bauen auf fehlerhaften Ergebnissen auf, driften weiter vom Ziel ab und machen das Debuggen teurer und zeitaufwendiger.

Deterministische Steuerelemente führen klare Pass-/Fail-Signale ein:

  • Unit-Tests überprüfen, ob die Änderungen des Agenten das erwartete Verhalten bewirkt haben.
  • Linters erzwingen Struktur und Konsistenz, verhindern Formatierungsprobleme, Formatabweichungen und vermeidbare Bereinigungsarbeiten.
  • Sicherheitsscans erkennen riskante Muster frühzeitig, bevor sie sich nur noch schwer rückgängig machen lassen.

Zusammen bilden diese Kontrollmechanismen eine enge Rückkopplungsschleife: Der Agent nimmt eine Änderung vor, ein Test, eine Regel oder ein Scan bewertet sie, und der Agent passt sein Vorgehen an, bevor er fortfährt. Dies verhindert lange Ketten falscher Änderungen, die einer der größten Treiber von Tokenverschwendung sind.

Teams, die in diese Guardrails investieren, sehen weniger Wiederholungen, schnellere Aufgabenerledigung und vorhersagbares Agentverhalten. Sie reduzieren häufig den Gesamtverbrauch von Token, auch wenn einzelne Schritte im Voraus etwas mehr Token verwenden.

Nächste Schritte

Neben der Verbesserung der Agenteneffizienz können Sie auch Ihre Ausgaben überwachen und verwalten, um das Beste aus Ihrem AI credits herauszuholen:

  • Nutzen Sie Ihr Dashboard und Budgetkontrollen. Die Seite „KI-Nutzung“ unter https://github.com/settings/billing schlüsselt den Verbrauch nach jeder Funktion und jedem Modell auf, sodass Sie sehen können, wofür Ihre Guthaben tatsächlich verwendet werden, und entsprechend Anpassungen vornehmen.
  • Identifizieren Sie kostenintensive Muster, bevor sich die Kosten summieren. Verwenden Sie in einer Copilot CLI-Sitzung /usage, um Metriken auf Sitzungsebene einzusehen und während Sie arbeiten ressourcenintensive Muster zu erkennen. Darüber hinaus analysiert /chronicle tips Ihren jüngsten Sitzungsverlauf und zeigt Möglichkeiten auf, Copilot effizienter zu nutzen.
  • Upgrade für ein größeres Kontingent. Wenn Sie regelmäßig an Ihr monatliches Limit stoßen, kann ein höherer Plan kostengünstiger sein, als für zusätzliche Nutzung zu bezahlen, da höhere Pläne mehr AI credit Kontingent umfassen. Siehe Informationen zu individuellen GitHub Copilot Plänen und Vorteilen und Anzeigen und Ändern Ihres GitHub Copilot-Plans.