PROPUESTA ESTRATÉGICA & TÉCNICA
Integración de LLMs y Document Understanding: De la solución Nativa a la Arquitectura Híbrida con LangChain.
Visión pragmática para la toma de decisiones: ¿Qué ganamos y cuánto cuesta?
Automatizar la ingesta de documentos (OCR) y el análisis de datos (LLM) directamente en NetSuite, eliminando digitación manual y acelerando la toma de decisiones.
N/llm,
N/documentCapture). Ideal para MVP.
Separados y Predecibles:
Procesamiento de facturas, extracción de tablas en contratos, clasificación de correos de soporte, chatbots internos RAG.
Uso directo de los módulos integrados en NetSuite 2024.1+. Sin servidores externos.
Para digitalización. Envías un PDF y recibes un JSON con campos y tablas.
Para generación de texto y chat.
llm.generateText().
Veredicto: Ideal para tareas simples y rápidas.
El problema: NetSuite no procesa vectores, no corre Python,
y sus timeouts son
cortos.
La solución: Delegar la "inteligencia" a OCI Functions usando
langchain-oracle.
Es el conector oficial. Permite:
OCI es la base segura, pero la arquitectura híbrida nos permite conectar todo.
Modelos alojados y gestionados por Oracle. Privacidad total.
"Bring Your Own Model". Despliega modelos de HuggingFace en GPUs dedicadas.
Conexión vía API desde OCI Functions usando LangChain wrappers.
Separación crítica para el presupuesto: Páginas (OCR) vs. Transacciones (LLM).
| Servicio | Unidad de Cobro | Precio Estimado* | Notas Críticas |
|---|---|---|---|
| OCI Document Understanding (OCR) | Por Página | $10 - $25 USD per 1,000 pages |
Varía si es solo texto (barato) o extracción de campos clave/tablas (más caro). Las facturas requieren extracción de campos. |
| OCI GenAI (Llama 3 70B) | Por Transacción (Carácter) |
~$0.03 USD per 1M chars |
Modelo Open Source hosteado. Extremadamente barato para resúmenes y clasificación. |
| OCI GenAI (Cohere Command R) | Por Transacción (Carácter) |
~$0.50 - $2.00 USD per 1M chars |
Modelo propietario. Mejor razonamiento, pero más costoso. Usar solo para tareas complejas. |
Usar N/documentCapture para digitalizar facturas entrantes. Sin código
externo.
Rápido "time-to-market".
Desplegar OCI Functions con langchain-oracle. Conectar a Oracle Database
23ai
para hacer RAG sobre manuales o políticas internas.
Evaluar si Llama 3 es suficiente o si se requiere GPT-4o para casos edge. Ajustar el enrutador en Python.
Conclusión: La arquitectura híbrida es la única que garantiza escalabilidad a largo plazo sin quedar atados a las limitaciones de SuiteScript, aprovechando costos bajos de OCI.
Jairo Mendoza | LatamReady