Ir al contenido
Nibiru docsv0.9.2

Plan de Ruta para IA

Dónde está yendo la integración de IA de Nibiru — el plan que nos lleva de un Oracle basado en RAG a una LoRA ajustada para producción.

Stable Reading time ~ 2 min Edit on GitHub

El ambicioso de Nibiru: ser el primer marco PHP con un modelo afinado entrenado en su propia conocimiento, ofrecido como una parte integral de la experiencia de desarrollo. Esta página rastrea los pasos.

  • Fragmentador de Markdown con límites H2/H3.
  • Embeddings de OpenAI (text-embedding-3-small).
  • Índice vectorial como un solo archivo JSON.
  • Punto final de Astro /api/oracle que llama a Claude con el contexto recuperado.
  • Widget de chat flotante en cada página de documentación.
  • Entrada y salida multilingües (EN/DE/JA/ES/FR).

¿Por qué primero? RAG funciona sin entrenamiento, escala linealmente con el tamaño del contenido y es muy barato. Cada edición de un documento mejora la calidad de las respuestas en la misma hora.

Fase 2 — Siguiente: Corpus público + receta LoRA

Sección titulada «Fase 2 — Siguiente: Corpus público + receta LoRA»
  • npm run build:corpus se envía en main (instrucciones/chat/chunks JSONL).
  • Conjunto de datos publicado en Hugging Face (nibiru-framework/docs-corpus).
  • Referencia Axolotl YAML para Llama 3.1 8B.
  • Receta de referencia para Qwen 2.5 7B y Mistral Nemo 12B.
  • Conjunto de evaluación: 200 preguntas manuscritas de Nibiru con respuestas correctas.

¿Por qué segundo? Una vez que el corpus es reproducible desde los documentos, cualquiera puede entrenar. Tratamos los documentos como la fuente de la verdad y el corpus como un artefacto derivado.

  • Entrenar una primera pasada de LoRA en el corpus público.
  • Servir a través de vLLM detrás de /api/oracle con un indicador de característica.
  • Interfaz de usuario al lado a lado comparando Claude (RAG) vs LoRA (sin RAG) vs LoRA + RAG.
  • Telemetría: ¿qué formulario prefiere el usuario por tipo de pregunta?

¿Por qué tercero. La comparación lado a lado revela dónde ayuda el LoRA (estilo idiomático de Nibiru) y dónde lo perjudica (contexto muy largo, ediciones recientes aún no reentrenadas).

Fase 4 — Eventualmente: Agentes de edición

Sección titulada «Fase 4 — Eventualmente: Agentes de edición»
  • Plugin de PHPStorm: resaltar un controlador, pedirle al Oracle que lo convierta en un módulo.
  • Agente CLI: ./nibiru ask "reescribe este controlador como un endpoint JSON".
  • Bot de revisión de PR: explicar las deviaciones específicas de Nibiru en solicitudes de extracción en forques del framework.
  • El feedback del usuario en el widget de chat (👍 / 👎) escribe una fila en un conjunto de datos privado.
  • La cola de revisión semanal muestra respuestas con bajas calificaciones para anotación humana.
  • Las respuestas mejoradas vuelven a entrar en el corpus en el siguiente ciclo de entrenamiento.
  • Pregunta al Oráculo preguntas difíciles y califica las respuestas.
  • Abre problemas en el repositorio de GitHub para temas faltantes.
  • Contribuye traducciones — cada página de documentación traducida también es una fila del corpus paralelo.
  • Prueba un ajuste fino de LoRA en el corpus publicado y comparte los resultados.