Zum Inhalt springen
Nibiru docsv0.9.2

AI Roadmap

Wo die KI-Integration von Nibiru hingehört – der Plan, uns vom auf RAG-basierenden Oracle zu einem fein abgestimmten LoRA in der Produktion zu bringen.

Stable Reading time ~ 2 min Edit on GitHub

Nibiru’s Ambition: Sei das erste PHP-Framework mit einem fein abgestimmten Modell, das auf eigene Kenntnisse trainiert wurde, das als erstklassiger Bestandteil der Entwicklererfahrung angeboten wird. Diese Seite verfolgt die Schritte.

  • Markdown-Segmentierer mit H2/H3-Grenzen.
  • OpenAI-Einbettungen (text-embedding-3-small).
  • Vektorindex als einzelne JSON-Datei.
  • Astro-Endpunkt /api/oracle, der Claude mit abgeruftem Kontext aufruft.
  • Gleitender Chat-Widget auf jeder Dokumentationsseite.
  • Mehrsprachig (EN/DE/JA/ES/FR) Eingabe + Ausgabe.

Warum zuerst. RAG funktioniert ohne Training, skaliert linear mit der Inhaltsgröße und ist sehr günstig. Jede Dokumentenbearbeitung verbessert die Antwortqualität in derselben Stunde.

Phase 2 — Nächster Schritt: Öffentlicher Korpus + LoRA Rezept

Abschnitt betitelt „Phase 2 — Nächster Schritt: Öffentlicher Korpus + LoRA Rezept“
  • npm run build:corpus wird in main bereitgestellt (Anleitungen/Chat/Ausschnitte JSONL).
  • Veröffentlichung des Hugging Face-Datasets (nibiru-framework/docs-corpus).
  • Referenzieren Sie die Axolotl-YAML für Llama 3.1 8B.
  • Referenzieren Sie die Rezepte für Qwen 2.5 7B und Mistral Nemo 12B.
  • Bewertungsmenge: 200 von Hand bewertete Nibiru-Fragen mit goldenen Antworten.

Warum zweitens. Sobald das Korpus aus den Dokumenten reproduzibel ist, kann jeder trainieren. Wir behandeln die Dokumente als Quelle der Wahrheit und das Korpus als abgeleitetes Artefakt.

  • Trainen Sie einen ersten Durchgang von LoRA auf dem öffentlichen Korpus.
  • Bereitstellen Sie über vLLM hinter /api/oracle mit einem Feature-Flag.
  • Seite an Seite Benutzeroberfläche zum Vergleich zwischen Claude (RAG) und LoRA (ohne RAG) sowie LoRA + RAG.
  • Telemetrie: Welches Formular bevorzugt der Benutzer je nach Frageart?

Warum drittens. Eine Seite-an-Seite-Vergleich zeigt, wo die LoRA hilft (idiomatischer Nibiru-Stil) und wo sie schadet (sehr langer Kontext, frische Bearbeitungen sind noch nicht neu trainiert).

  • PHPStorm-Erweiterung: markieren Sie einen Controller und fragen Sie den Oracle, ihn in ein Modul umzuwandeln.
  • CLI-Agent: ./nibiru ask "diese Kontroller als JSON-Endpunkt umschreiben".
  • PR-Review-Bot: erklären Sie Nibiru-spezifische Abweichungen in Pull Requests auf Framework-Forks.
  • Benutzerfeedback im Chat-Widget (👍 / 👎) schreibt eine Zeile in ein privates Dataset.
  • Die wöchentliche Überprüfungswarteschlange hebt niedrig bewertete Antworten für menschliche Anmerkungen hervor.
  • Verbesserte Antworten gelangen wieder ins Korpus im nächsten Trainingszyklus.
  • Stellen Sie den Oracle schwierige Fragen und bewerten Sie die Antworten.
  • Öffnen Sie Issues im GitHub Repo für fehlende Themen.
  • Tragen Sie Übersetzungen bei — jede übersetzte Dokumentenseite ist auch eine Zeile des parallelen Korpus.
  • Probieren Sie eine LoRA Fine-Tuning auf dem veröffentlichten Korpus und teilen Sie die Ergebnisse.