Executando e criando seus próprios LLMs localmente com API Node.js usando Ollama

Primeira página > Programação > Executando e criando seus próprios LLMs localmente com API Node.js usando Ollama

Executando e criando seus próprios LLMs localmente com API Node.js usando Ollama

Publicado em 14/08/2024

Navegar:973

Running and Creating Your Own LLMs Locally with Node.js API using Ollama

Neste guia, você aprenderá como executar Large Language Models (LLMs) em sua máquina local e criar seu próprio LLM. Também abordaremos como criar uma API para seu modelo personalizado usando a biblioteca ollama-js em Node.js.

Passo 1: Instalando o Ollama

Ollama é a escolha ideal para executar LLMs localmente devido à sua simplicidade e compatibilidade com máquinas sem uso intensivo de GPU. Comece instalando o Ollama no site oficial:

Site oficial de Ollama

Etapa 2: selecionando seu modelo LLM preferido

Depois de instalar o Ollama, você pode escolher entre uma variedade de modelos LLM disponíveis. Você pode encontrar a lista de modelos disponíveis no repositório GitHub:

Repositório GitHub Ollama

Etapa 3: executando o modelo localmente

Para executar o modelo localmente, use o seguinte comando em seu terminal. Observe que a primeira execução pode demorar mais, pois o Ollama baixa e armazena o modelo localmente. As execuções subsequentes serão mais rápidas, pois o modelo é acessado localmente.

ollama run {model_name}

Etapa 4: Criando seu próprio LLM

Para criar seu LLM personalizado, você precisa criar um arquivo de modelo. Abaixo está um exemplo de como definir seu modelo:

FROM 

# Define your parameters here
PARAMETER temperature 0.5

SYSTEM """
You are an English teaching assistant named Mr. Kamal Kishor. You help with note-making, solving English grammar assignments, and reading comprehensions.
"""

Salve como arquivo de modelo. Para criar o modelo a partir deste arquivo, execute o seguinte comando em seu terminal:

ollama create mrkamalkishor -f ./modelfile

Depois de criar o modelo, você pode interagir com ele localmente usando:

ollama run mrkamalkishor

Etapa 5: Criando uma API Node.js para o modelo personalizado

Para esta etapa, usaremos a biblioteca ollama-js para criar uma API em Node.js.

Instale a biblioteca Ollama em seu projeto Node.js:

npm install ollama

Crie seu endpoint de API:

import express from 'express';
import ollama from 'ollama';

const app = express();
const router = express.Router();

app.use(express.json());

router.post('/ask-query', async (req, res) => {
  const { query } = req.body;

  try {
    const response = await ollama.chat({
      model: 'mrkamalkishor',
      messages: [{ role: 'user', content: query }],
    });

    res.json({ reply: response.message.content });
  } catch (error) {
    res.status(500).send({ error: 'Error interacting with the model' });
  }
});

app.use('/api', router);

const PORT = process.env.PORT || 3000;
app.listen(PORT, () => {
  console.log(`Server is running on port ${PORT}`);
});

Este código configura um servidor Express.js com um endpoint para interagir com seu modelo personalizado. Quando uma solicitação POST é feita para /ask-query com um corpo JSON contendo a consulta do usuário, o servidor responde com a saída do modelo.

Resumo

Seguindo essas etapas, você pode instalar o Ollama, escolher e executar LLMs localmente, criar seu LLM personalizado e configurar uma API Node.js para interagir com ele. Essa configuração permite que você aproveite modelos de linguagem poderosos em sua máquina local sem a necessidade de hardware com uso intensivo de GPU.

Declaração de lançamento Este artigo foi reproduzido em: https://dev.to/koolkamalkishor/running-and-creating-your-own-llms-locally-with-nodejs-api-using-ollama-97f?1 Se houver alguma violação, por favor entre em contato com study_golang@163 .comdelete

Tutorial mais recente Mais>

Como resolver o erro "Não é possível adivinhar o tipo de arquivo, usar aplicativo/stream de octeto ..." no AppEngine?
AppEngine Arquivo estático MIME TIPO SUBSENTIDE No AppEngine, os manipuladores de arquivos estáticos podem ocasionalmente substituir o tipo de...

Programação Postado em 2025-05-25
Por que as junções da esquerda parecem intra-conexões ao filtrar na cláusula onde na tabela direita?
junção de junção de esquerda: horas de bruxa quando se transforma em uma junção interna em um reino de um assistente de banco de dados, executar...

Programação Postado em 2025-05-25
$Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?$
Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?
como recuperar a contagem máxima usando o mysql em mysql, você pode encontrar um problema enquanto tenta encontrar a contagem máxima de valore...

Programação Postado em 2025-05-25
Quando um aplicativo Go Go fecha a conexão do banco de dados?
Gerenciando conexões de banco de dados em Applications Go Web em aplicativos simples Go Web que utilizam bancos de dados como PostGresql, o mome...

Programação Postado em 2025-05-25
Método para a passagem correta dos ponteiros da função do membro C ++
como passar os ponteiros da função do membro em C Ao passar uma função de membro da classe para uma função que aceita um ponteiro de membro: (...

Programação Postado em 2025-05-25
Como posso ler com eficiência um arquivo grande em ordem inversa usando o Python?
lendo um arquivo em ordem inversa em python se você estiver trabalhando com um arquivo grande e precisar ler seus conteúdos da última linha pa...

Programação Postado em 2025-05-25
Como converter uma coluna Pandas Dataframe em formato e filtrar por data de tempo por data?
transformar a coluna Pandas Dataframe em DateTime Format cenário: Dados em um Pandas Dataframe frequentemente existe em vários formatos, inc...

Programação Postado em 2025-05-25
Método para converter corretamente os caracteres Latin1 em UTF8 na tabela UTF8 MySQL
Converte os caracteres latin1 em uma tabela utf8 em utf8 você encontrou um problema em que os caracteres com diacritos (por exemplo, "jáu...

Programação Postado em 2025-05-25
Como corrigir “Erro geral: o servidor MySQL 2006 desapareceu” ao inserir dados?
Como resolver "Erro geral: o servidor MySQL de 2006 desapareceu" ao inserir registrosIntrodução:A inserção de dados em um banco de dados MyS...

Programação Postado em 2025-05-25
Maneira eficiente do Python de remover tags html do texto
removendo tags html em python para uma representação textual intocada manipular respostas html geralmente envolve a extração de texto relevant...

Programação Postado em 2025-05-25
Como redirecionar vários tipos de usuários (alunos, professores e administradores) para suas respectivas atividades em um aplicativo Firebase?
RED: Como redirecionar vários tipos de usuário para as respectivas atividades compreender o problema e um aplicativo de votamento de que é...

Programação Postado em 2025-05-25
CSS fortemente a análise de linguagem digitada
Uma das maneiras pelas quais você pode classificar uma linguagem de programação é o quão fortemente ou fracamente é digitado. Aqui, “digitado” signif...

Programação Postado em 2025-05-25
Razões para o Codeigniter se conectar ao banco de dados MySQL depois de mudar para MySqli
Unable to Connect to MySQL Database: Troubleshooting Error MessageWhen attempting to switch from the MySQL driver to the MySQLi driver in CodeIgniter,...

Programação Postado em 2025-05-25
Futuro do PHP: adaptação e inovação
O futuro do PHP será alcançado adaptando -se a novas tendências de tecnologia e introduzindo recursos inovadores: 1) adaptação à computação em nuvem,...

Programação Postado em 2025-05-25
Dicas para encontrar a posição do elemento em Java Array
Recuperando a posição do elemento em Java Arrays na classe Java's Arrays, não há método "indexof" direto para determinar a posiç...

Programação Postado em 2025-05-25

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo