Explore la biblioteca Jlama con Spring Boot y Langchain

Página delantera > Programación > Explore la biblioteca Jlama con Spring Boot y Langchain

Explore la biblioteca Jlama con Spring Boot y Langchain

Publicado el 2025-04-17

Navegar:834

Explorando a Biblioteca JLama com Spring Boot e LangChain

Modelos de lenguaje grande (LLMS) están transformando varios campos, incluido el desarrollo de software. Su capacidad para comprender y generar texto (y otros tipos de datos) permite la sugerencia de código, la corrección e incluso la generación a partir de las indicaciones textuales. Este artículo explora la biblioteca jlama , una solución basada en Java para integrar LLM en el ecosistema Java. JLama ofrece flexibilidad, utilizable como interfaz de línea de comandos (CLI) o como dependencia en sus proyectos (por ejemplo, a través de pom.xml ). Demostraremos su funcionalidad integrándolo con una aplicación spring boot .

Prerrequisitos y resaltados

jlama requiere java 20 o superior debido a su uso de la API Java Vector. Los usuarios existentes langchain pueden integrarlo con jlama, aprovechando las herramientas de Langchain para la interacción LLM simplificada.

Este proyecto de ejemplo presenta dos puntos finales que interactúan con LLM a través de indicaciones:

a Jlama-solo Endpoint.
a Langchain y Jlama combinado de punto final.

Implementación del proyecto

Jlama Endpoint

Este punto final utiliza directamente JLAMA para generar respuestas basadas en las indicaciones del usuario.

@PostMapping("/jlama") // Endpoint for JLama chat functionality
public ResponseEntity chatJlama(@RequestBody ChatPromptRequest request) {
    PromptContext context;
    if (abstractModel.promptSupport().isPresent()) {
        context = abstractModel.promptSupport()
                .get()
                .builder()
                .addSystemMessage("You are a helpful chatbot providing concise answers.")
                .addUserMessage(request.prompt())
                .build();
    } else {
        context = PromptContext.of(request.prompt());
    }

    System.out.println("Prompt: "   context.getPrompt()   "\n");
    Generator.Response response = abstractModel
            .generate(UUID.randomUUID(), context, 0.0f, 256, (s, f) -> {});
    System.out.println(response.responseText);

    return ResponseEntity.ok(new ChatPromptResponse(response.responseText));
}

se define el modelo deseado. Si no está disponible localmente, se descarga automáticamente al directorio especificado. Se crea el contexto rápido y JLama genera la respuesta.

// Defining the model and directory for downloading (if needed) from Hugging Face
String model = "tjake/Llama-3.2-1B-Instruct-JQ4";
String workingDirectory = "./models";

// Downloading (if necessary) or retrieving the model locally
File localModelPath = new Downloader(workingDirectory, model).huggingFaceModel();

// Loading the model
ModelSupport.loadModel(localModelPath, DType.F32, DType.I8);

langchain y jlama endpoint

Este punto final usa langchain, reduciendo el código requerido para la interacción jlama.

@PostMapping("/langchain")
public ResponseEntity

langchain simplifica la implementación definiendo el modelo y los parámetros directamente dentro del constructor.

enlaces y referencias

Este proyecto fue inspirado en la presentación del profesor Isidro en Soujava. [Enlace a la presentación (reemplace con el enlace real si está disponible)]

documentación útil:

JLama en GitHub [enlace a JLama GitHub (reemplazar con enlace real)]
langchain [enlace a la documentación de langchain (reemplazar con enlace real)]

Conclusión

JLama y Langchain proporcionan una forma poderosa de integrar LLM en aplicaciones Java. Este artículo demostró cómo configurar y usar estas herramientas con el arranque de Spring para crear puntos finales de procesamiento de solicitud textual eficiente.

¿ha trabajado con LLM en proyectos Java? ¡Comparta sus experiencias e ideas en los comentarios!

Último tutorial Más>

¿Cómo extraer susteras antes de los subrayadores en Oracle SQL?
extrayendo subcadenas a un carácter específico en Oracle sql Problema: Seleccionando los subcandinras de una columna que contiene resultados ...

Programación Publicado el 2025-05-06
¿Cómo limitar el rango de desplazamiento de un elemento dentro de un elemento principal de tamaño dinámico?
implementando límites de altura de CSS para los elementos de desplazamiento vertical en una interfaz interactiva, controlar el comportamiento ...

Programación Publicado el 2025-05-06
Guía para resolver problemas de Cors en Spring Security 4.1 y superior
Spring Security Cors Filter: Solución de problemas de problemas comunes Al integrar la seguridad de la primavera en un proyecto existente, pue...

Programación Publicado el 2025-05-06
¿Cómo usar correctamente las consultas como los parámetros PDO?
usando consultas similares en pdo al intentar implementar una consulta similar en PDO, puede encontrar problemas como el que se describe en la...

Programación Publicado el 2025-05-06
¿Cómo puedo iterar e imprimir sincrónicamente los valores de dos matrices de igual tamaño en PHP?
iterando e imprimiendo los valores de dos matrices del mismo tamaño cuando se crea un Selectbox usando dos matrices de igual tamaño, uno que con...

Programación Publicado el 2025-05-06
¿Cómo puedo manejar múltiples cargas de archivos con FormData ()?
Manejo de múltiples cargas de archivo con formdata () Cuando se trabaja con entradas de archivos, a menudo es necesario manejar múltiples carg...

Programación Publicado el 2025-05-06
¿Cómo puedo generar eficientemente las babosas amigables con la URL a partir de cuerdas Unicode en PHP?
elaborando una función para una generación de babosas eficiente creando babosas, representaciones simplificadas de las cadenas unicode utiliza...

Programación Publicado el 2025-05-06
¿Cuándo cierra una aplicación web GO la conexión de la base de datos?
Administración de conexiones de base de datos en aplicaciones web GO en aplicaciones web simples Go que utilizan bases de datos como PostgreSQL,...

Programación Publicado el 2025-05-06
¿Por qué el DateTime de PHP :: Modify ('+1 mes') produce resultados inesperados?
modificando meses con php datetime: descubrir el comportamiento previsto cuando se trabaja con la clase de datetime de PHP, suma o ritir meses...

Programación Publicado el 2025-05-06
¿Cómo puedo unir tablas de bases de datos con diferentes números de columnas?
tablas combinadas con diferentes columnas ]] puede encontrar desafíos al intentar fusionar las tablas de la base de datos con diferentes column...

Programación Publicado el 2025-05-06
¿Cuáles fueron las restricciones al usar Current_Timestamp con columnas de marca de tiempo en MySQL antes de la versión 5.6.5?
en las columnas de la marca de tiempo con cursion_timestamp en predeterminado o en las cláusulas de actualización en las versiones mySql antes de ...

Programación Publicado el 2025-05-06
¿Estará realmente el despertar falso en Java?
Los despertar espurios en java: realidad o mito? El concepto de despertar espurios en la sincronización de Java ha sido un tema de discusión dur...

Programación Publicado el 2025-05-06
`console.log` muestra el motivo de la excepción de valor de objeto modificado
objetos y console.log: una rareza desordenada cuando trabaja con objetos y console.log, puede encontrar un comportamiento peculiar. Desenvuelv...

Programación Publicado el 2025-05-06
¿Cómo los map.entry de Java y simplificando la gestión de pares de valores clave?
una colección integral para pares de valor: Introducción de Java Map.entry y SimpleEntry en Java, al definir una colección donde cada elemento...

Programación Publicado el 2025-05-06
¿Por qué las imágenes todavía tienen fronteras en Chrome? `Border: Ninguno;` Solución inválida
eliminando el borde de la imagen en Chrome un problema frecuente encontrado cuando se trabaja con imágenes en Chrome e IE9 es la apariencia de...

Programación Publicado el 2025-05-06

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo