Plan de Ruta para IA
Dónde está yendo la integración de IA de Nibiru — el plan que nos lleva de un Oracle basado en RAG a una LoRA ajustada para producción.
El ambicioso de Nibiru: ser el primer marco PHP con un modelo afinado entrenado en su propia conocimiento, ofrecido como una parte integral de la experiencia de desarrollo. Esta página rastrea los pasos.
Fase 1 — Hoy: RAG Oracle ✓
Sección titulada «Fase 1 — Hoy: RAG Oracle ✓»- Fragmentador de Markdown con límites H2/H3.
- Embeddings de OpenAI (
text-embedding-3-small). - Índice vectorial como un solo archivo JSON.
- Punto final de Astro
/api/oracleque llama a Claude con el contexto recuperado. - Widget de chat flotante en cada página de documentación.
- Entrada y salida multilingües (EN/DE/JA/ES/FR).
¿Por qué primero? RAG funciona sin entrenamiento, escala linealmente con el tamaño del contenido y es muy barato. Cada edición de un documento mejora la calidad de las respuestas en la misma hora.
Fase 2 — Siguiente: Corpus público + receta LoRA
Sección titulada «Fase 2 — Siguiente: Corpus público + receta LoRA»-
npm run build:corpusse envía enmain(instrucciones/chat/chunks JSONL). - Conjunto de datos publicado en Hugging Face (
nibiru-framework/docs-corpus). - Referencia Axolotl YAML para Llama 3.1 8B.
- Receta de referencia para Qwen 2.5 7B y Mistral Nemo 12B.
- Conjunto de evaluación: 200 preguntas manuscritas de Nibiru con respuestas correctas.
¿Por qué segundo? Una vez que el corpus es reproducible desde los documentos, cualquiera puede entrenar. Tratamos los documentos como la fuente de la verdad y el corpus como un artefacto derivado.
Fase 3 — Luego: Endpoint alojado de LoRA
Sección titulada «Fase 3 — Luego: Endpoint alojado de LoRA»- Entrenar una primera pasada de LoRA en el corpus público.
- Servir a través de vLLM detrás de
/api/oraclecon un indicador de característica. - Interfaz de usuario al lado a lado comparando Claude (RAG) vs LoRA (sin RAG) vs LoRA + RAG.
- Telemetría: ¿qué formulario prefiere el usuario por tipo de pregunta?
¿Por qué tercero. La comparación lado a lado revela dónde ayuda el LoRA (estilo idiomático de Nibiru) y dónde lo perjudica (contexto muy largo, ediciones recientes aún no reentrenadas).
Fase 4 — Eventualmente: Agentes de edición
Sección titulada «Fase 4 — Eventualmente: Agentes de edición»- Plugin de PHPStorm: resaltar un controlador, pedirle al Oracle que lo convierta en un módulo.
- Agente CLI:
./nibiru ask "reescribe este controlador como un endpoint JSON". - Bot de revisión de PR: explicar las deviaciones específicas de Nibiru en solicitudes de extracción en forques del framework.
Fase 5 — Aspiracional: Aprendizaje activo
Sección titulada «Fase 5 — Aspiracional: Aprendizaje activo»- El feedback del usuario en el widget de chat (👍 / 👎) escribe una fila en un conjunto de datos privado.
- La cola de revisión semanal muestra respuestas con bajas calificaciones para anotación humana.
- Las respuestas mejoradas vuelven a entrar en el corpus en el siguiente ciclo de entrenamiento.
Cómo ayudar
Sección titulada «Cómo ayudar»- Pregunta al Oráculo preguntas difíciles y califica las respuestas.
- Abre problemas en el repositorio de GitHub para temas faltantes.
- Contribuye traducciones — cada página de documentación traducida también es una fila del corpus paralelo.
- Prueba un ajuste fino de LoRA en el corpus publicado y comparte los resultados.