PROPUESTA ESTRATÉGICA & TÉCNICA

OCI AI + NETSUITE
ECOSYSTEM

Integración de LLMs y Document Understanding: De la solución Nativa a la Arquitectura Híbrida con LangChain.


Arquitectura
Nativa vs Híbrida

LangChain
Orquestación Avanzada

Costos Reales
OCR vs GenAI

RESUMEN EJECUTIVO

Visión pragmática para la toma de decisiones: ¿Qué ganamos y cuánto cuesta?

El Objetivo

Automatizar la ingesta de documentos (OCR) y el análisis de datos (LLM) directamente en NetSuite, eliminando digitación manual y acelerando la toma de decisiones.

Rutas de Implementación

  • Ruta Rápida (Nativa): Usar módulos SuiteScript 2.1 (N/llm, N/documentCapture). Ideal para MVP.
  • Ruta Robusta (Híbrida): Python en OCI Functions. Necesaria para lógica compleja o modelos externos.

Estructura de Costos

Separados y Predecibles:

  • OCR: Se paga por página (~$0.01 - $0.025/pág).
  • GenAI: Se paga por transacción/carácter. Llama 3 es muy económico (~$0.03/1M chars).
  • Infraestructura: OCI Functions solo cobra por milisegundos de ejecución.

Aplicaciones Clave

Procesamiento de facturas, extracción de tablas en contratos, clasificación de correos de soporte, chatbots internos RAG.

OPCIÓN A: ARQUITECTURA NATIVA

SUITESCRIPT 2.1

Uso directo de los módulos integrados en NetSuite 2024.1+. Sin servidores externos.

N/documentCapture

Para digitalización. Envías un PDF y recibes un JSON con campos y tablas.

  • Integrado en UI de NetSuite.
  • Solo soporta modelos pre-entrenados de OCI (Facturas, Recibos, Driver ID, Pasaportes).

N/llm

Para generación de texto y chat.

  • Fácil de usar: llm.generateText().
  • Limitado a modelos OCI (Cohere/Llama). Timeout de script de 45s/5m.
Usuario NetSuite
SuiteScript
(UserEvent / Suitelet)
⬇ Invoca Módulos
OCI GenAI
OCI Doc AI

Veredicto: Ideal para tareas simples y rápidas.

OPCIÓN B: HÍBRIDA CON LANGCHAIN

PYTHON + LANGCHAIN

El problema: NetSuite no procesa vectores, no corre Python, y sus timeouts son cortos.
La solución: Delegar la "inteligencia" a OCI Functions usando langchain-oracle.

NetSuite
(N/https)
JSON Payload
OCI API Gateway
(Seguridad)
Trigger
OCI Functions
(Python)
LangChain
Multi-LLM
OCI/OpenAI

Librería `langchain-oracle`

Es el conector oficial. Permite:

  1. Cargar documentos desde Object Storage.
  2. Generar Embeddings (Vectores).
  3. Conectar a Oracle Database 23ai para Vector Search.
  4. Orquestar cadenas de pensamiento (Chain of Thought).

Ventajas Híbridas

  • Agnóstico: Tu código Python puede llamar a OCI GenAI hoy, y a OpenAI mañana.
  • Potencia: Usa Pandas para limpiar tablas complejas del OCR antes de devolverlas a NetSuite.
  • Memoria: LangChain maneja el historial del chat (Memory), algo difícil de hacer en SuiteScript puro.

ECOSISTEMA MULTI-PROVEEDOR

OCI es la base segura, pero la arquitectura híbrida nos permite conectar todo.

OCI Managed (Nativo)

Modelos alojados y gestionados por Oracle. Privacidad total.


  • Meta Llama 3 (70B/8B)
  • Cohere Command R+
  • Cohere Embed v3

OCI Data Science (BYOM)

"Bring Your Own Model". Despliega modelos de HuggingFace en GPUs dedicadas.


  • Mistral / Mixtral
  • Falcon
  • Google Gemma

Externos (Vía Python)

Conexión vía API desde OCI Functions usando LangChain wrappers.


  • OpenAI (GPT-4o)
  • Google Gemini Pro
  • Anthropic Claude

ESTRUCTURA DE COSTOS REALES

Separación crítica para el presupuesto: Páginas (OCR) vs. Transacciones (LLM).

Servicio Unidad de Cobro Precio Estimado* Notas Críticas
OCI Document Understanding (OCR) Por Página $10 - $25 USD
per 1,000 pages
Varía si es solo texto (barato) o extracción de campos clave/tablas (más caro). Las facturas requieren extracción de campos.
OCI GenAI (Llama 3 70B) Por Transacción
(Carácter)
~$0.03 USD
per 1M chars
Modelo Open Source hosteado. Extremadamente barato para resúmenes y clasificación.
OCI GenAI (Cohere Command R) Por Transacción
(Carácter)
~$0.50 - $2.00 USD
per 1M chars
Modelo propietario. Mejor razonamiento, pero más costoso. Usar solo para tareas complejas.
Insight de Costos: Para procesar 1,000 facturas, gastarás mucho más en el OCR (lectura) que en el LLM (análisis). Estrategia: Usa OCR solo para extraer datos crudos y pásaselos a Llama 3 (barato) para validaciones lógicas.

ROADMAP DE IMPLEMENTACIÓN

FASE 1

MVP Nativo

Usar N/documentCapture para digitalizar facturas entrantes. Sin código externo. Rápido "time-to-market".

FASE 2

Inteligencia Híbrida

Desplegar OCI Functions con langchain-oracle. Conectar a Oracle Database 23ai para hacer RAG sobre manuales o políticas internas.

FASE 3

Escalado Multi-Modelo

Evaluar si Llama 3 es suficiente o si se requiere GPT-4o para casos edge. Ajustar el enrutador en Python.

Conclusión: La arquitectura híbrida es la única que garantiza escalabilidad a largo plazo sin quedar atados a las limitaciones de SuiteScript, aprovechando costos bajos de OCI.

Jairo Mendoza | LatamReady