Ejecutar Llama en Android: una guía paso a paso usando Ollama

Página delantera > Programación > Ejecutar Llama en Android: una guía paso a paso usando Ollama

Ejecutar Llama en Android: una guía paso a paso usando Ollama

Publicado el 2024-11-09

Navegar:785

Running Llama on Android: A Step-by-Step Guide Using Ollama

Llama 3.2 se presentó recientemente en la Conferencia de Desarrolladores de Meta, mostrando impresionantes capacidades multimodales y una versión optimizada para dispositivos móviles que utilizan hardware Qualcomm y MediaTek. Este avance permite a los desarrolladores ejecutar potentes modelos de IA como Llama 3.2 en dispositivos móviles, allanando el camino para aplicaciones de IA más eficientes, privadas y receptivas.

Meta lanzó cuatro variantes de Llama 3.2:

Modelos multimodales con 11 mil millones (11B) y 90 mil millones (90B) de parámetros.
Modelos de solo texto con mil millones (1B) y 3 mil millones (3B) de parámetros.

Los modelos más grandes, especialmente las variantes 11B y 90B, destacan en tareas como la comprensión de imágenes y el razonamiento de gráficos, a menudo superando a otros modelos como Claude 3 Haiku e incluso compitiendo con GPT-4o-mini en ciertos casos. Por otro lado, los modelos livianos 1B y 3B están diseñados para generación de texto y capacidades multilingües, lo que los hace ideales para aplicaciones en dispositivos donde la privacidad y la eficiencia son clave.

En esta guía, le mostraremos cómo ejecutar Llama 3.2 en un dispositivo Android usando Termux y Ollama. Termux proporciona un entorno Linux en Android y Ollama ayuda a administrar y ejecutar modelos grandes localmente.

¿Por qué ejecutar Llama 3.2 localmente?

La ejecución de modelos de IA localmente ofrece dos beneficios principales:

Procesamiento instantáneo ya que todo se maneja en el dispositivo.
Privacidad mejorada ya que no es necesario enviar datos a la nube para su procesamiento.

Aunque todavía no hay muchos productos que permitan que los dispositivos móviles ejecuten modelos como Llama 3.2 sin problemas, aún podemos explorarlo usando un entorno Linux en Android.

Pasos para ejecutar Llama 3.2 en Android

1. Instale Termux en Android

Termux es un emulador de terminal que permite que los dispositivos Android ejecuten un entorno Linux sin necesidad de acceso de root. Está disponible de forma gratuita y se puede descargar desde la página de Termux GitHub.

Para esta guía, descarga termux-app_v0.119.0-beta.1 apt-android-7-github-debug_arm64-v8a.apk e instálalo en tu dispositivo Android.

2. Configurar Termux

Después de iniciar Termux, siga estos pasos para configurar el entorno:

Otorgar acceso al almacenamiento:

   termux-setup-storage

Este comando permite a Termux acceder al almacenamiento de su dispositivo Android, lo que permite una administración de archivos más sencilla.

Actualizar paquetes:

   pkg upgrade

Ingrese Y cuando se le solicite actualizar Termux y todos los paquetes instalados.

Instalar herramientas esenciales:

   pkg install git cmake golang

Estos paquetes incluyen Git para el control de versiones, CMake para la creación de software y Go, el lenguaje de programación en el que está escrito Ollama.

3. Instalar y compilar Ollama

Ollama es una plataforma para ejecutar modelos grandes localmente. Aquí se explica cómo instalarlo y configurarlo:

Clonar el repositorio GitHub de Ollama:

   git clone --depth 1 https://github.com/ollama/ollama.git

Navega al Directorio de Ollama:

   cd ollama

Generar código Go:

   go generate ./...

Construir Ollama:

   go build .

Iniciar servidor Ollama:

   ./ollama serve &

Ahora el servidor de Ollama se ejecutará en segundo plano, lo que le permitirá interactuar con los modelos.

4. Ejecución de modelos Llama 3.2

Para ejecutar el modelo Llama 3.2 en tu dispositivo Android, sigue estos pasos:

Elige un modelo:
- Modelos como llama3.2:3b (3 mil millones de parámetros) están disponibles para probar. Estos modelos están cuantificados para mayor eficiencia. Puedes encontrar una lista de modelos disponibles en el sitio web de Ollama.
Descargar y ejecutar el modelo Llama 3.2:

   ./ollama run llama3.2:3b --verbose

El indicador --verbose es opcional y proporciona registros detallados. Una vez completada la descarga, puedes comenzar a interactuar con el modelo.

5. Gestión del desempeño

Al probar Llama 3.2 en dispositivos como el Samsung S21 Ultra, el rendimiento fue fluido para el modelo 1B y manejable para el modelo 3B, aunque es posible que notes un retraso en el hardware más antiguo. Si el rendimiento es demasiado lento, cambiar al modelo 1B más pequeño puede mejorar significativamente la capacidad de respuesta.

Limpieza opcional

Después de usar Ollama, es posible que desees limpiar el sistema:

Eliminar archivos innecesarios:

   chmod -R 700 ~/go
   rm -r ~/go

Mover el binario Ollama a una ruta global:

   cp ollama/ollama /data/data/com.termux/files/usr/bin/

Ahora puedes ejecutar ollama directamente desde la terminal.

Conclusión

Llama 3.2 representa un gran avance en la tecnología de inteligencia artificial, al llevar modelos potentes y multimodales a dispositivos móviles. Al ejecutar estos modelos localmente utilizando Termux y Ollama, los desarrolladores pueden explorar el potencial de las aplicaciones de IA en el dispositivo que priorizan la privacidad y que no dependen de la infraestructura de la nube. Con modelos como Llama 3.2, el futuro de la IA móvil parece brillante, permitiendo soluciones de IA más rápidas y seguras en diversas industrias.

Declaración de liberación Este artículo se reproduce en: https://dev.to/koolkamalkishor/running-llama-32-on-android-a-step-by-step-guide-using-ollama-54ig?1 Si hay alguna infracción, por favor contacto Study_golang@163 .comeliminar

Último tutorial Más>

El error del compilador "usr/bin/ld: no se puede encontrar -l" solución
Error encontrado: "usr/bin/ld: no puedo encontrar -l " -l usr/bin/ld: cannot find -l<nameOfTheLibrary> agregando rutas de ...

Programación Publicado el 2025-05-19
¿Por qué las expresiones de Lambda requieren variables "finales" o "válidas finales" en Java?
Las expresiones lambda requieren variables "finales" o "efectivamente finales" El mensaje de error "variable utilizad...

Programación Publicado el 2025-05-19
Guía para resolver problemas de Cors en Spring Security 4.1 y superior
Spring Security Cors Filter: Solución de problemas de problemas comunes Al integrar la seguridad de la primavera en un proyecto existente, pue...

Programación Publicado el 2025-05-19
Guía de visualización de compensación de tiempo local del usuario y zona horaria de la zona horaria
que muestra la fecha/hora en el formato local del usuario con el tiempo offset al presentar fechas y tiempos a los usuarios finales, es crucia...

Programación Publicado el 2025-05-19
¿Cómo localizar la imagen de fondo CSS de la derecha?
imagen de fondo de la derecha con css En el reino del desarrollo web, a menudo es deseable colocar precisamente imágenes de fondo dentro de el...

Programación Publicado el 2025-05-19
Razones para que CodeIgniter se conecte a la base de datos MySQL después de cambiar a MySQLI
No se puede conectar a la base de datos mySQL: Mensaje de error de solución de problemas al intentar cambiar desde el controlador mySQL al con...

Programación Publicado el 2025-05-19
¿Cómo usar correctamente las consultas como los parámetros PDO?
usando consultas similares en pdo al intentar implementar una consulta similar en PDO, puede encontrar problemas como el que se describe en la...

Programación Publicado el 2025-05-19
¿Cómo combinar datos de tres tablas MySQL en una nueva tabla?
mysql: creando una nueva tabla de datos y columnas de tres tablas pregunta: ¿cómo puedo crear una nueva tabla que combine los datos selecci...

Programación Publicado el 2025-05-19
¿Cómo protegen los desarrolladores de Java las credenciales de la base de datos de la descompilación?
Protecting de las credenciales de la base de datos de la descompilación en java en Java, descompilar archivos de clase es relativamente sencil...

Programación Publicado el 2025-05-19
Razones por las cuales Python no informa errores al corte de la subconjuntos de hiperescopio
Substring Sliting con índice fuera de rango: dualidad y secuencias vacías en Python, acceder a elementos de una secuencia utilizando el operad...

Programación Publicado el 2025-05-19
¿Cómo recuperar la última biblioteca jQuery de Google API?
recuperando la última biblioteca jQuery de Google APIS La URL de jQuery proporcionada en la pregunta es para la versión 1.2.6. Para recuperar ...

Programación Publicado el 2025-05-19
¿Por qué Java no puede crear matrices genéricas?
Error de creación de matriz genérica [&] pregunta: cuando intentan crear una variedad de clases genéricas usando una expresión como: Publi...

Programación Publicado el 2025-05-19
¿Puedes usar CSS para la salida de la consola de color en Chrome y Firefox?
que muestra los colores en la console JavaScript es posible usar la consola de Chrome para mostrar texto coloreado, como rojo para errores, na...

Programación Publicado el 2025-05-19
Eval () vs. AST.LITERAL_EVAL (): ¿Qué función de Python es más segura para la entrada del usuario?
pesando eval () y Ast.literal_eval () en Python Security Al manejar la entrada del usuario, es imperativo priorizar la seguridad. eval (), una...

Programación Publicado el 2025-05-19
¿Estará realmente el despertar falso en Java?
Los despertar espurios en java: realidad o mito? El concepto de despertar espurios en la sincronización de Java ha sido un tema de discusión dur...

Programación Publicado el 2025-05-19

Clasificación Más>

Aprende japonés Aprender coreano Aprender chino Aprender idioma extranjero Juego Problema comun Periféricos tecnológicos AI Tutoriales de software Programación Artículo