AI Roadmap
Wo die KI-Integration von Nibiru hingehört – der Plan, uns vom auf RAG-basierenden Oracle zu einem fein abgestimmten LoRA in der Produktion zu bringen.
Nibiru’s Ambition: Sei das erste PHP-Framework mit einem fein abgestimmten Modell, das auf eigene Kenntnisse trainiert wurde, das als erstklassiger Bestandteil der Entwicklererfahrung angeboten wird. Diese Seite verfolgt die Schritte.
Phase 1 — Heute: RAG Oracle ✓
Abschnitt betitelt „Phase 1 — Heute: RAG Oracle ✓“- Markdown-Segmentierer mit H2/H3-Grenzen.
- OpenAI-Einbettungen (
text-embedding-3-small). - Vektorindex als einzelne JSON-Datei.
- Astro-Endpunkt
/api/oracle, der Claude mit abgeruftem Kontext aufruft. - Gleitender Chat-Widget auf jeder Dokumentationsseite.
- Mehrsprachig (EN/DE/JA/ES/FR) Eingabe + Ausgabe.
Warum zuerst. RAG funktioniert ohne Training, skaliert linear mit der Inhaltsgröße und ist sehr günstig. Jede Dokumentenbearbeitung verbessert die Antwortqualität in derselben Stunde.
Phase 2 — Nächster Schritt: Öffentlicher Korpus + LoRA Rezept
Abschnitt betitelt „Phase 2 — Nächster Schritt: Öffentlicher Korpus + LoRA Rezept“-
npm run build:corpuswird inmainbereitgestellt (Anleitungen/Chat/Ausschnitte JSONL). - Veröffentlichung des Hugging Face-Datasets (
nibiru-framework/docs-corpus). - Referenzieren Sie die Axolotl-YAML für Llama 3.1 8B.
- Referenzieren Sie die Rezepte für Qwen 2.5 7B und Mistral Nemo 12B.
- Bewertungsmenge: 200 von Hand bewertete Nibiru-Fragen mit goldenen Antworten.
Warum zweitens. Sobald das Korpus aus den Dokumenten reproduzibel ist, kann jeder trainieren. Wir behandeln die Dokumente als Quelle der Wahrheit und das Korpus als abgeleitetes Artefakt.
Phase 3 — Dann: Gehosteter LoRA-Endpunkt
Abschnitt betitelt „Phase 3 — Dann: Gehosteter LoRA-Endpunkt“- Trainen Sie einen ersten Durchgang von LoRA auf dem öffentlichen Korpus.
- Bereitstellen Sie über vLLM hinter
/api/oraclemit einem Feature-Flag. - Seite an Seite Benutzeroberfläche zum Vergleich zwischen Claude (RAG) und LoRA (ohne RAG) sowie LoRA + RAG.
- Telemetrie: Welches Formular bevorzugt der Benutzer je nach Frageart?
Warum drittens. Eine Seite-an-Seite-Vergleich zeigt, wo die LoRA hilft (idiomatischer Nibiru-Stil) und wo sie schadet (sehr langer Kontext, frische Bearbeitungen sind noch nicht neu trainiert).
Phase 4 — Schließlich: Editor-Agents
Abschnitt betitelt „Phase 4 — Schließlich: Editor-Agents“- PHPStorm-Erweiterung: markieren Sie einen Controller und fragen Sie den Oracle, ihn in ein Modul umzuwandeln.
- CLI-Agent:
./nibiru ask "diese Kontroller als JSON-Endpunkt umschreiben". - PR-Review-Bot: erklären Sie Nibiru-spezifische Abweichungen in Pull Requests auf Framework-Forks.
Phase 5 — Aspirational: Aktives Lernen
Abschnitt betitelt „Phase 5 — Aspirational: Aktives Lernen“- Benutzerfeedback im Chat-Widget (👍 / 👎) schreibt eine Zeile in ein privates Dataset.
- Die wöchentliche Überprüfungswarteschlange hebt niedrig bewertete Antworten für menschliche Anmerkungen hervor.
- Verbesserte Antworten gelangen wieder ins Korpus im nächsten Trainingszyklus.
Wie Sie helfen können
Abschnitt betitelt „Wie Sie helfen können“- Stellen Sie den Oracle schwierige Fragen und bewerten Sie die Antworten.
- Öffnen Sie Issues im GitHub Repo für fehlende Themen.
- Tragen Sie Übersetzungen bei — jede übersetzte Dokumentenseite ist auch eine Zeile des parallelen Korpus.
- Probieren Sie eine LoRA Fine-Tuning auf dem veröffentlichten Korpus und teilen Sie die Ergebnisse.