Spring BootとLangchainでJlama Libraryを探索してください

表紙 > プログラミング > Spring BootとLangchainでJlama Libraryを探索してください

Spring BootとLangchainでJlama Libraryを探索してください

2025-04-17に投稿されました

ブラウズ：916

Explorando a Biblioteca JLama com Spring Boot e LangChain

大規模な言語モデル（LLM）は、ソフトウェア開発を含むさまざまな分野を変換しています。テキスト（およびその他のデータ型）を理解して生成する能力により、テキストプロンプトからのコード提案、修正、さらには生成が可能になります。この記事では、LLMをJavaエコシステムに統合するためのJavaベースのソリューションである Jlama ライブラリを調査します。 Jlamaは、コマンドラインインターフェイス（CLI）として、またはプロジェクトの依存関係として使用可能な柔軟性を提供します（例： pom.xml ）。 spring boot application。

と統合することにより、その機能を実証します。

前提条件とハイライト

Jlamaは、Java Vector APIを使用しているため、 20以上を必要とします。既存の langchain ユーザーはJlamaと統合でき、Langchainのツールをレバレッジして、単純化したLLM相互作用を活用します。

この例プロジェクトには、プロンプトを介してLLMと対話する2つのエンドポイントがあります。

jlamaのみのエンドポイント。
LangchainとJlamaの組み合わせエンドポイント。

プロジェクト実装

jlama endpoint

このエンドポイントは、Jlamaを直接利用してユーザープロンプトに基づいて応答を生成します。

@PostMapping("/jlama") // Endpoint for JLama chat functionality
public ResponseEntity chatJlama(@RequestBody ChatPromptRequest request) {
    PromptContext context;
    if (abstractModel.promptSupport().isPresent()) {
        context = abstractModel.promptSupport()
                .get()
                .builder()
                .addSystemMessage("You are a helpful chatbot providing concise answers.")
                .addUserMessage(request.prompt())
                .build();
    } else {
        context = PromptContext.of(request.prompt());
    }

    System.out.println("Prompt: "   context.getPrompt()   "\n");
    Generator.Response response = abstractModel
            .generate(UUID.randomUUID(), context, 0.0f, 256, (s, f) -> {});
    System.out.println(response.responseText);

    return ResponseEntity.ok(new ChatPromptResponse(response.responseText));
}

目的のモデルが定義されています。ローカルで利用できない場合は、指定されたディレクトリに自動的にダウンロードされます。プロンプトコンテキストが作成され、Jlamaが応答を生成します。

// Defining the model and directory for downloading (if needed) from Hugging Face
String model = "tjake/Llama-3.2-1B-Instruct-JQ4";
String workingDirectory = "./models";

// Downloading (if necessary) or retrieving the model locally
File localModelPath = new Downloader(workingDirectory, model).huggingFaceModel();

// Loading the model
ModelSupport.loadModel(localModelPath, DType.F32, DType.I8);

LangchainとJlama Endpoint

このエンドポイントはLangchainを使用して、Jlamaインタラクションに必要なコードを減らします。

@PostMapping("/langchain")
public ResponseEntity

Langchainは、ビルダー内でモデルとパラメーターを直接定義することにより、実装を簡素化します。

リンクと参照

このプロジェクトは、ソウハヴァでのイシドロ教授のプレゼンテーションに触発されました。 [プレゼンテーションへのリンク（利用可能な場合は実際のリンクと交換）]

有用なドキュメント：

jlama on github [Jlamagithubへのリンク（実際のリンクに置き換え）]
langchain [langchainドキュメントへのリンク（実際のリンクに置き換え）]

結論

JlamaとLangchainは、LLMをJavaアプリケーションに統合する強力な方法を提供します。この記事では、Spring Bootでこれらのツールを構成および使用して、効率的なテキストプロンプト処理エンドポイントを作成する方法を示しました。

JavaプロジェクトでLLMSと協力したことがありますか？コメントであなたの経験と洞察を共有してください！

最新のチュートリアルもっと>

Javaのフルスクリーン専用モードでユーザー入力を処理する方法は？
ハンドリングユーザー入力は、java intuling in full screenの排他的モードでのフルスクリーンの排他的モードでのハンドリングを排他的モードで実行するとき、通常のイベント処理メカニズムは予想されるように機能しない場合があります。この記事では、このモードでキーボード...

プログラミング 2025-07-21に投稿されました
なぜsqlalchemyフィルター条項で「flake8」はブールの比較にフラグを立てるのですか？
flake8 Flake8 Flake8フラグをフィルター節のブール比較 SQLのブール比較に基づいてクエリ結果をフィルタリングしようとすると、開発者は「==」の使用に関してFLAKE8から警告を発する可能性があります。一般に、「condがfalse」または「condではない場合：」を...

プログラミング 2025-07-21に投稿されました
ChatBotコマンドの実行のためにリアルタイムでstdoutをキャプチャしてストリーミングする方法は？
コマンド実行からリアルタイムでstdoutをキャプチャする再起動のライン（コマンド）： print（line）このコードでは、subprocess.popen（）関数を使用して指定されたコマンドを実行します。 stdoutパラメーターは、subprocess....

プログラミング 2025-07-21に投稿されました
なぜLambdaの式には、Javaの「最終」または「有効な最終」変数が必要なのですか？
lambda式には、「最終」または「効果的に最終」変数は、「ラムダ式で使用される変数が最終または効果的に最終的に」を示すことを示します。 final。 //コードがありません cal.getComponents（）。getComponents（ "vtimez...

プログラミング 2025-07-21に投稿されました
1つのトランザクションでデータを複数のMySQLテーブルに効率的に挿入する方法は？
mysqlは複数のテーブルに挿入されます単一のMySQLクエリを持つ複数のテーブルにデータを挿入しようとすると、予期しない結果が得られる場合があります。複数のクエリが問題を解決するように思われるかもしれませんが、プロファイルテーブルのユーザーテーブルからマニュアルユーザーIDに自動イン...

プログラミング 2025-07-21に投稿されました
GOでSQLクエリを構築するときに、テキストと値を安全に連結するにはどうすればよいですか？
go sql queries のテキストと値を連結するgoのテキストsqlクエリを構築する際に、特に文字列を使用した場合、文字列を使用した場合に、文字列を使用する場合、アプローチはGOでは有効ではなく、文字列としてパラメーターをキャストしようとすると、タイプのミスマッチエラーが発生しま...

プログラミング 2025-07-21に投稿されました
Javaが一般的な配列を作成できないのはなぜですか？
generic array作成エラー質問： ; public static ArrayList<myObject>[] a = new ArrayList<myObject>[2];

プログラミング 2025-07-21に投稿されました
年と四半期の列をパンダの1つの定期的な列にマージする方法は？
新しい期間の列の列の連結問題ステートメント： 2000 Q2 2001 Q3 目的は、「年」と「四分の一」の列を組み合わせて「期間」と呼ばれる新しい列を作成して、次の結果を取得することです。 2001q3 ソリューション：はpythonで文字列列を連結するために、...

プログラミング 2025-07-21に投稿されました
フォームリフレッシュ後に重複した提出を防ぐ方法は？
を更新することで重複した提出を防ぐ Web開発で、フォームの提出後にページが更新された場合に重複した提出の問題に遭遇することが一般的です。これに対処するには、次のアプローチを検討してください。 if（isset（$ _ post ['name']））{ ...

プログラミング 2025-07-21に投稿されました
JavaのMap.EntryとSimpleEntryはどのようにキー価値ペア管理を単純化しますか？
valueペアの包括的なコレクション：javaのmap.entry and simpleEntry をJavaで紹介します。 However, for scenarios where maintaining the order of elements is crucial and un...

プログラミング 2025-07-21に投稿されました
入力：なぜ「警告：mysqli_query（）がパラメーター1がmysqliであると予想し、リソースが与えられた「エラーが発生し、それを修正する方法」出力：エラーを解決するための分析と修正「警告：mysqli_query（）パラメーターは、リソースの代わりにmysqliである必要があります」
mysqli_query（）は、パラメーター1がmysqliであることを期待しています。発生する可能性があります。このエラーは、最初のパラメーターのタイプと予想されるリソースタイプとの間の不一致を示します。これらの2つの拡張機能は交換可能ではなく、一緒に使用することはできません。 MySQ...

プログラミング 2025-07-21に投稿されました
C ++ 20 consteval関数のテンプレートパラメーターは関数パラメーターに依存できますか？
consteval関数とテンプレートパラメーターは関数引数では、テンプレートパラメーターは関数引数に依存することはできません。 c 20 consteval関数 c 20 consteval関数を導入します。コンパイル時間で評価する必要があります。ただし、問題は残ります。これ...

プログラミング 2025-07-21に投稿されました
右からCSSの背景画像を見つける方法は？
右からの背景画像をCSS をWeb開発の領域で配置すると、要素内に背景画像を正確に配置することが望ましいことがよくあります。要素の左側に関連する背景画像を配置するのは簡単ですが、右から特定の数のピクセルをオフセットするにはどうすればよいですか？ /を右から10pxを配置するための動作...

プログラミング 2025-07-21に投稿されました
PHPでタイムゾーンを効率的に変換する方法は？
php での効率的なタイムゾーン変換は、タイムゾーンの取り扱いは簡単なタスクになる可能性があります。このガイドは、異なるタイムゾーン間で日付と時間を変換するための簡単な実装方法を提供します。たとえば、 //ユーザーのタイムゾーンを定義します date_default_timezone_s...

プログラミング 2025-07-21に投稿されました
コンテナ内のdiv用のスムーズな左右のCSSアニメーションを作成する方法は？
左右の動きのための一般的なCSSアニメーションこの記事では、一般的なCSSアニメーションを作成して、その容器の端に到達する左右に移動することを探ります。このアニメーションは、その未知の長さに関係なく、絶対的なポジショニングで任意のdivに適用できます。これは、100％で、divの左のプロ...

プログラミング 2025-07-21に投稿されました