Explore a biblioteca JLAMA com bota de primavera e Langchain

Primeira página > Programação > Explore a biblioteca JLAMA com bota de primavera e Langchain

Explore a biblioteca JLAMA com bota de primavera e Langchain

Postado em 2025-04-17

Navegar:737

Explorando a Biblioteca JLama com Spring Boot e LangChain

grandes modelos de idiomas (LLMS) estão transformando vários campos, incluindo o desenvolvimento de software. Sua capacidade de entender e gerar texto (e outros tipos de dados) permite sugestão de código, correção e até geração a partir de instruções textuais. Este artigo explora a biblioteca jlama , uma solução baseada em Java para integrar o LLMS no ecossistema java. O JLAMA oferece flexibilidade, utilizável como uma interface da linha de comando (CLI) ou como uma dependência em seus projetos (por exemplo, via pom.xml ). Demonstraremos sua funcionalidade integrando -a com uma inicialização Spring Application.

pré -requisitos e destaques

jlama requer java 20 ou superior devido ao uso da API do vetor java. Os usuários existentes Langchain podem integrá -lo com o JLAMA, alavancando as ferramentas de Langchain para a interação simplificada de LLM.

Este exemplo do projeto apresenta dois pontos de extremidade interagindo com o LLMS por meio de prompts:

um endpoint apenas JLama.
Um Langchain e Jlama Combined Endpoint.

Projeto Implementation

jlama endpoint

Este endpoint utiliza diretamente o JLAMA para gerar respostas com base em prompts do usuário.

@PostMapping("/jlama") // Endpoint for JLama chat functionality
public ResponseEntity chatJlama(@RequestBody ChatPromptRequest request) {
    PromptContext context;
    if (abstractModel.promptSupport().isPresent()) {
        context = abstractModel.promptSupport()
                .get()
                .builder()
                .addSystemMessage("You are a helpful chatbot providing concise answers.")
                .addUserMessage(request.prompt())
                .build();
    } else {
        context = PromptContext.of(request.prompt());
    }

    System.out.println("Prompt: "   context.getPrompt()   "\n");
    Generator.Response response = abstractModel
            .generate(UUID.randomUUID(), context, 0.0f, 256, (s, f) -> {});
    System.out.println(response.responseText);

    return ResponseEntity.ok(new ChatPromptResponse(response.responseText));
}

O modelo desejado é definido. Se não estiver disponível localmente, é baixado automaticamente para o diretório especificado. O contexto imediato é criado e a JLAMA gera a resposta.

// Defining the model and directory for downloading (if needed) from Hugging Face
String model = "tjake/Llama-3.2-1B-Instruct-JQ4";
String workingDirectory = "./models";

// Downloading (if necessary) or retrieving the model locally
File localModelPath = new Downloader(workingDirectory, model).huggingFaceModel();

// Loading the model
ModelSupport.loadModel(localModelPath, DType.F32, DType.I8);

Langchain e Jlama endpoint

Este endpoint usa Langchain, reduzindo o código necessário para a interação JLAMA.

@PostMapping("/langchain")
public ResponseEntity

Langchain simplifica a implementação definindo o modelo e os parâmetros diretamente dentro do construtor.

links e referências

Este projeto foi inspirado pela apresentação do professor Isidro em Soujava. [Link para a apresentação (substitua pelo link real, se disponível)]

documentação útil:

jlama no github [link para jlama github (substitua pelo link real)]
Langchain [link para documentação de Langchain (substitua pelo link real)]

Conclusão

JLAMA e LANGCHAIN fornecem uma maneira poderosa de integrar o LLMS nos aplicativos Java. Este artigo demonstrou como configurar e usar essas ferramentas com a inicialização da primavera para criar pontos de extremidade de processamento de prompt de textual eficiente.

você já trabalhou com LLMS em projetos java? Compartilhe suas experiências e insights nos comentários!

Tutorial mais recente Mais>

Por que as expressões lambda exigem variáveis "final" ou "final válida" em Java?
expressões lambda requerem "final" ou "efetivamente" variáveis a mensagem de erro "BEATILE Utilizada na expressão l...

Programação Postado em 2025-05-07
Ubuntu 12.04 Guia de correção de erro de conexão local MySQL

Programação Postado em 2025-05-07
Como repetir com eficiência caracteres de string para recuo em C#?
repetindo uma string para o indentação Ao recuperar uma string com base na profundidade de um item, é conveniente ter uma maneira eficiente de...

Programação Postado em 2025-05-07
Como posso lidar com os nomes de arquivos UTF-8 nas funções do sistema de arquivos do PHP?
lidando com utf-8 nomes de arquivos nas funções do sistema de arquivos do PHP Ao criar pastas que contêm caracteres utf-8 usando a função mkdi...

Programação Postado em 2025-05-07
Dicas para encontrar a posição do elemento em Java Array
Recuperando a posição do elemento em Java Arrays na classe Java's Arrays, não há método "indexof" direto para determinar a posiç...

Programação Postado em 2025-05-07
Guia para resolver problemas de CORS no Spring Security 4.1 e acima
Spring Security cors filter: solucionando problemas comuns Ao integrar a segurança da primavera em um projeto existente, você pode encontrar e...

Programação Postado em 2025-05-07
Como implementar uma função de hash genérico para tuplas em coleções não ordenadas?
função de hash genérico para tuplas em coleções não ordenadas o std :: não -ordered_map e std :: uncomered_set contêineres fornecem pesquisa e...

Programação Postado em 2025-05-07
Preciso excluir explicitamente as alocações de heap em C ++ antes da saída do programa?
exclusão explícita em c, apesar do programa exit ao trabalhar com a alocação de memória dinâmica em C, os desenvolvedores geralmente se pergun...

Programação Postado em 2025-05-07
Como descobrir dinamicamente os tipos de pacote de exportação no idioma Go?
encontrando tipos de pacote exportados dinamicamente em contraste com os recursos de descoberta de tipo limitado no pacote refletir, este arti...

Programação Postado em 2025-05-07
Como adicionar eixos e tags aos arquivos PNG em Java?
como anotar um arquivo png com eixos e etiquetas em java adicionar eixos e etiquetas a uma imagem png existente pode ser um desafio. Em vez de...

Programação Postado em 2025-05-07
Por que o Microsoft Visual C ++ falha ao implementar corretamente a instanciação do modelo bifásico?
O mistério do modelo de duas fases "quebrado" bifásia instanciação no Microsoft Visual C Declaração de Problema: STRAGLES Expressa...

Programação Postado em 2025-05-07
Como inserir com eficiência dados em várias tabelas MySQL em uma transação?
mysql Inserir em múltiplas tabelas tentando inserir dados em várias tabelas com uma única consulta MySQL pode produzir resultados inesperados....

Programação Postado em 2025-05-07
Razões para o Codeigniter se conectar ao banco de dados MySQL depois de mudar para MySqli
Unable to Connect to MySQL Database: Troubleshooting Error MessageWhen attempting to switch from the MySQL driver to the MySQLi driver in CodeIgniter,...

Programação Postado em 2025-05-07
Por que há listras no meu fundo linear de gradiente e como posso consertá -las?
banindo as faixas de fundo do gradiente linear Ao empregar a propriedade linear de gradiente para um plano de fundo, você pode encontrar listr...

Programação Postado em 2025-05-07
Como recuperar com eficiência a última linha para cada identificador exclusivo no PostGresql?
postGresql: Extraindo a última linha para cada identificador exclusivo em postgresql, você pode encontrar situações em que você precisa extrai...

Programação Postado em 2025-05-07

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo