Voie d'avenir de l'IA
Où va l'intégration de l'IA de Nibiru — le plan qui nous mène d'un Oracle basé sur RAG à un LoRA affiné en production.
L’ambition de Nibiru : être le premier framework PHP avec un modèle affiné formé sur ses propres connaissances, servi en tant que partie intégrante de l’expérience de développement. Cette page suit les étapes.
Phase 1 — Aujourd’hui : Oracle RAG ✓
Section intitulée « Phase 1 — Aujourd’hui : Oracle RAG ✓ »- Segmentateur Markdown avec des limites H2/H3.
- Embeddings OpenAI (
text-embedding-3-small). - Index vectoriel en tant que seul fichier JSON.
- Point d’accès Astro
/api/oracleappelant Claude avec le contexte récupéré. - Widget de chat flottant sur chaque page de documentation.
- Multilingue (EN/DE/JA/ES/FR) entrée + sortie.
Pourquoi en premier. RAG fonctionne sans formation, échelle linéairement avec la taille du contenu et est très abordable. Chaque édition de document améliore la qualité des réponses dans la même heure.
Phase 2 — Étape suivante : Corpus public + recette LoRA
Section intitulée « Phase 2 — Étape suivante : Corpus public + recette LoRA »-
npm run build:corpusest inclus dansmain(instructions/chat/chunks JSONL). - Jeu de données publié sur Hugging Face (
nibiru-framework/docs-corpus). - Référence YAML Axolotl pour Llama 3.1 8B.
- Référence recette pour Qwen 2.5 7B et Mistral Nemo 12B.
- Ensemble d’évaluation : 200 questions manuellement notées de Nibiru avec des réponses correctes.
Pourquoi deuxième. Une fois que le corpus est reproductible à partir des documents, tout le monde peut l’entraîner. Nous traitons les documents comme la source de vérité et le corpus comme un artefact dérivé.
Phase 3 — Ensuite : Point de terminaison hébergé LoRA
Section intitulée « Phase 3 — Ensuite : Point de terminaison hébergé LoRA »- Formernez un premier passage LoRA sur le corpus public.
- Servez via vLLM derrière
/api/oracleavec un indicateur de fonctionnalité. - Interface utilisateur côte à côte comparant Claude (RAG) vs LoRA (sans RAG) vs LoRA + RAG.
- Télémétrie : quelle forme préfère l’utilisateur par type de question ?
Pourquoi le troisième ? Une comparaison côte à côte révèle où la LoRA aide (style idiomatique de Nibiru) et où elle nuit (contexte très long, modifications récentes non encore réentraînées).
Phase 4 — Éventuellement : Agents d’édition
Section intitulée « Phase 4 — Éventuellement : Agents d’édition »- Plugin PHPStorm : mettre en évidence un contrôleur, demander à l’Oracle de le convertir en module.
- Agent CLI :
./nibiru ask "réécrire ce contrôleur comme un point d'accès JSON". - Bot de revue PR : expliquer les déviations spécifiques à Nibiru dans les demandes de tirage sur les forques du framework.
Phase 5 — Aspirational : Apprentissage actif
Section intitulée « Phase 5 — Aspirational : Apprentissage actif »- Le retour d’information de l’utilisateur dans le widget de chat (👍 / 👎) écrit une ligne dans un jeu de données privé.
- La file d’attente hebdomadaire présente les réponses notées faiblement pour annotation humaine.
- Les réponses améliorées re-rentrent dans le corpus lors du cycle de formation suivant.
Comment vous pouvez aider
Section intitulée « Comment vous pouvez aider »- Posez des questions difficiles à l’Oracle et évaluez les réponses.
- Ouvrez des problèmes sur le dépôt GitHub pour les sujets manquants.
- Contribuez aux traductions — chaque page de documentation traduite est également une ligne du corpus parallèle.
- Essayez un fine-tuning LoRA sur le corpus publié et partagez les résultats.