顧客の解約を予測するための決定ツリー分類器の例

表紙 > プログラミング > 顧客の解約を予測するための決定ツリー分類器の例

顧客の解約を予測するための決定ツリー分類器の例

2025-02-06に投稿しました

ブラウズ：581

Decision Tree Classifier Example to Predict Customer Churn

顧客の解約を予測するための決定ツリー分類器の例

概要

このプロジェクトは、意思決定ツリー分類器を使用して顧客チャーン（顧客がサービスを辞めるかどうか）を予測する方法を示しています。データセットには、 age 、 monthle Charges 、のカスタマーサービスコールなどの機能が含まれます。 モデルは、Scikit-Learnの決定ツリー分類器を使用してトレーニングされ、コードは決定ツリーを視覚化して、モデルが決定をどのようにしているかをよりよく理解します。

使用されたテクノロジー

：モデルの構築に使用される一次言語。
：データの操作と処理データセットの場合。
：データ視覚化の場合（決定ツリーをプロット）。。
：モデルトレーニングと評価を含む機械学習用。

説明された手順

1。

必要なライブラリをインポート

pdasとしてpandasをインポートします pltとしてmatplotlib.pyplotをインポートします警告をインポートします sklearn.model_selectionからimport train_test_splitから Sklearn.TreeからImport DecisionTreeClassifierから sklearn.metrics Import quarty_scoreから Sklearnインポートツリーから

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

pandas
（pd）：
これは、データの操作とデータフレーム形式へのロードに使用されます。データフレームを使用すると、テーブル（行や列）などの構造化データを整理および操作できます。
matplotlib
（plt）：
これは、データを視覚化するために使用されるプロットライブラリです。ここでは、決定ツリーをグラフィカルにプロットするために使用されます。これは、ツリーの各ノードで決定がどのように行われるかを理解するのに役立ちます。
警告
（警告）：
警告モジュールは、警告を抑制または処理するために使用されます。このコードでは、出力を清潔で読み取り可能に保つために不必要な警告を無視しています。
scikit-learn
ライブラリ：
- ：この関数は、データセットをトレーニングとテストサブセットに分割します。トレーニングデータはモデルの適合に使用され、テストデータを使用してパフォーマンスを評価します。
- ：これは、データの分類と顧客の解約を予測するために使用されるモデルです。意思決定ツリーは、機能に基づいた決定のツリーのようなモデルを作成することにより機能します。
- ：この関数は、予測値をターゲット変数（チャーン）の実際の値と比較することにより、モデルの精度を計算します。。
- ：このモジュールには、訓練されたら決定ツリーを視覚化するための関数が含まれています。

警告の抑制

警告filterwarnings（ "Ingrore"）

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

この行は、すべての警告

3。

data = { 「CustomerID」：範囲（1、101）、＃各顧客の一意のID 「年齢」：[20、25、30、35、40、45、50、55、60、65]10、＃顧客の年齢 'Monthly Charge'：[50、60、70、80、90、100、110、120、130、140]10、＃毎月の請求額「customerservicecalls」：[1、2、3、4、4、0、1、2、3、4、0]10、＃カスタマーサービスコールの数「チャーン」：['いいえ'、「いいえ」、「はい」、「いいえ」、「はい」、「いいえ」、「はい」、「はい」、「いいえ」、「はい」]10＃チャーンステータス } df = pd.dataframe（data） print（df.head（））

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

ここでは、プロジェクトの

を作成します。このデータセットは、年齢、毎月の充電、customerservicecalls、ターゲット変数チャーンなどの機能を備えた通信会社の顧客情報をシミュレートします（顧客がチャーンしたかどうか）。
。
customerId
- age
- MonthlyCharge
- customerservicecalls
- churn
：データはデータフレーム（df）として構成されており、2次元のラベル付きデータ構造であり、データの簡単な操作と分析を可能にします。
4。データを機能とターゲット変数に分割します

x = df [['age'、 'monthly charge'、 'customerservicecalls']]＃feature y = df ['churn']＃ターゲット変数

機能（x）

X = df[['Age', 'MonthlyCharge', 'CustomerServiceCalls']]  # Features
y = df['Churn']  # Target Variable

ターゲット変数（y）：従属変数。これは予測しようとしている値です。ここでは、顧客が解約するかどうかを示すチャーンコラムです。
5。データをトレーニングとテストセットに分割します

x_train、x_test、y_train、y_test = train_test_split（x、y、test_size = 0.3、random_state = 42）

train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

test_size = 0.3 ：データの30％がテスト用に確保されており、残りの70％はトレーニングに使用されます。。 random_state = 42 は、乱数ジェネレーターのシードを修正することにより、結果の再現性を保証します。
- 6。
- clf = decisiontreeclassifier（） clf.fit（x_train、y_train）

decisiontreeclassifier（）

decision treeモデルを初期化します。

clf.fit（x_train、y_train）

clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)

7。予測を作成
y_pred = clf.predict（x_test）

clf.predict（x_test）

：モデルがトレーニングされた後、テストセット（x_test）で予測を行うために使用されます。これらの予測値はy_predに保存され、モデルを評価するために実際の値（y_test）と比較します。。

8。

y_pred = clf.predict(X_test)

quarchy = quarchacy_score（y_test、y_pred）印刷（f "精度：{精度}"）

quarchaty_score（y_test、y_pred）

は、予測チャーンラベル（y_pred）とテストセットの実際のチャーンラベル（y_test）と比較することにより、モデルの精度を計算します。精度

は、いくつの予測が正しいかの尺度です。評価のために印刷されています。

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

決定ツリーを視覚化

：訓練された決定ツリーモデルを視覚化します。 fell = true引数は、クラスラベル（チャーン/チャーンなし）に基づいてノードを色付けします。

feature_names

：ツリーに表示する機能（独立変数）の名前を指定します。

import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import tree

：ターゲット変数（チャーン）のクラスラベルを指定します。。
：ツリーの視覚化を表示します。
コードを実行します
インストール依存関係：

PIPインストールPANDAS MATPLOTLIB SCIKIT-LEARN

PythonスクリプトまたはJupyterノートブックを実行して、モデルをトレーニングし、決定ツリーを視覚化します。

リリースステートメントこの記事は、https：//dev.to/atifwattoo/decision-tree-classifier-example-to-predict-customer-churn-51fc?1で再現されています。それ。

最新のチュートリアルもっと>

MySQLの2つの条件に基づいて行を効率的に挿入または更新する方法は？
2つの条件で挿入または更新する問題説明：既存の行一致が見つかった場合。この強力な機能により、一致する行が存在しない場合、または一意のキー制約が違反している場合は既存の行を更新する場合、新しい行を挿入することにより、効率的なデータ操作が可能になります。このキーは、テーブル内の一...

プログラミング 2025-05-14に投稿されました
MySQLデータベースメソッドは、同じインスタンスをダンプする必要はありません
同じインスタンスでmysqlデータベースをコピーする同じmysqlインスタンスでデータベースをコピーすることはできません。以下の方法は、従来のダンプアンドインポートプロセスのより簡単な代替手段を提供します。 | mysql new_db_name このコマンドは、new_db_nam...

プログラミング 2025-05-14に投稿されました
さまざまな数の列を持つデータベーステーブルを結合するにはどうすればよいですか？
異なる列とのテーブルを組み合わせた ] は、データベーステーブルを異なる列とマージしようとする場合に課題に遭遇する可能性があります。簡単な方法は、列が少ないテーブルに欠落している列にnull値を追加することです。たとえば、テーブルAと表Bの2つの表Aと表AがテーブルBよりも多くの列がある...

プログラミング 2025-05-14に投稿されました
Spring Security 4.1以降でCORSの問題を解決するためのガイド
スプリングセキュリティCORSフィルター：一般的な問題のトラブルシューティング既存のプロジェクトにスプリング関連エラーを統合する場合、「Access-Control-Origin」のようなヘッダーが応答に設定されていない場合にCORS関連のエラーに遭遇する場合があります。これを解決するに...

プログラミング 2025-05-14に投稿されました
右のテーブルの句でフィルタリングするとき、なぜ左結合が接続内に見えるのですか？
left join conundrum：witching時間：データベースウィザードの領域で内側の結合に変わる時間は、左結合を使用して複雑なデータ検索を実行することは一般的な慣行です。ただし、時々、左の結合が予想通りに動作しないことがあります。 A.foo、 B.BAR、 C.Foobar...

プログラミング 2025-05-14に投稿されました
なぜ有効なコードにもかかわらず、PHPで入力をキャプチャするリクエストを要求するのはなぜですか？
アドレス指定Php action='' を使用して、フォームの提出後に$ _POSTアレイの内容を確認します。適切に： if（empty（$ _ server ['content_type']）） { $ _Server ['content_typ...

プログラミング 2025-05-14に投稿されました
2Dアレイから要素を抽出する方法は？別の配列のインデックスを使用します
を使用して、numpyアレイを別の配列の2番目の次元のインデックスとして使用して 2番目のアレイによって提供されるインデックスに基づいて2Dアレイから特定の要素を抽出します。例： a = np.array（[[0,1]、[2,3]、[4,5]]） B = np.Array（[[1]、[...

プログラミング 2025-05-14に投稿されました
入力：なぜ「警告：mysqli_query（）がパラメーター1がmysqliであると予想し、リソースが与えられた「エラーが発生し、それを修正する方法」出力：エラーを解決するための分析と修正「警告：mysqli_query（）パラメーターは、リソースの代わりにmysqliである必要があります」
mysqli_query（）は、パラメーター1がmysqliであることを期待しています。発生する可能性があります。このエラーは、最初のパラメーターのタイプと予想されるリソースタイプとの間の不一致を示します。これらの2つの拡張機能は交換可能ではなく、一緒に使用することはできません。 MySQ...

プログラミング 2025-05-14に投稿されました
java.net.urlconnectionとmultipart/form-dataエンコードを使用して追加のパラメーターを使用してファイルをアップロードする方法は？
http requests を使用してファイルをhttpサーバーにアップロードしながら、追加のパラメーター、java.net.urlconnection、およびmultipart/dataエンコーディングを送信します。プロセスの内訳は次のとおりです。エンコーディングには、要求本体を複数...

プログラミング 2025-05-14に投稿されました
FASTAPIカスタム404ページ作成ガイド
custom 404 Fastapi を備えたPage not inound Page not foundページを作成するには、Fastapiがいくつかのアプローチを提供します。適切な方法は、特定の要件に依存します。 call_next（リクエスト） response.status_c...

プログラミング 2025-05-14に投稿されました
$Linuxサーバーにarchive_zipをインストールした後、\ "class \ 'ziparchive \'が見つかりません\"エラーを取得するのはなぜですか？$
Linuxサーバーにarchive_zipをインストールした後、\ "class \ 'ziparchive \'が見つかりません\"エラーを取得するのはなぜですか？
class 'ziparchive' linuxサーバーにarchive_zipをインストールする際のエラーは見つかりません症状：を実行しようとするときに、Ziparkive follingive folling_zip 0.1.1.1.1.1.1.1.1.1.1.1...

プログラミング 2025-05-14に投稿されました
Python Metaclass作業原則とクラスの作成とカスタマイズ
Pythonのメタクラスとは？クラスがインスタンスを作成するのと同じように、Metaclassはクラスを作成します。クラスの作成プロセスを制御する層を提供し、クラスの動作と属性のカスタマイズを可能にします。これは、クラス自体がクラスキーワードを使用してクラスの「説明」から作成されたインスタン...

プログラミング 2025-05-14に投稿されました
GOでSQLクエリを構築するときに、テキストと値を安全に連結するにはどうすればよいですか？
go sql queries のテキストと値を連結するgoのテキストsqlクエリを構築する際に、特に文字列を使用した場合、文字列を使用した場合に、文字列を使用する場合、アプローチはGOでは有効ではなく、文字列としてパラメーターをキャストしようとすると、タイプのミスマッチエラーが発生しま...

プログラミング 2025-05-14に投稿されました
プログラムを終了する前に、C ++のヒープ割り当てを明示的に削除する必要がありますか？
プログラム出口にもかかわらず、Cでの明示的な削除次の例を考慮してください。 a* a = new a（）; a-> dosomething（）; a; 0を返します。 } この例では、「削除」ステートメントは、「a」ポインターに割り当てられたヒープメモ...

プログラミング 2025-05-14に投稿されました
PHPとC ++関数の過負荷処理の違い
PHP関数の過負荷：cの観点から謎を解き明かす PHPの領域に挑戦する経験豊富なC開発者として、関数過負荷の概念に遭遇するかもしれません。この概念は、Cではありふれたものですが、PHPでユニークな課題を提起しています。 PHP関数の過負荷の複雑さを掘り下げて、それが提供する可能性を掘り下げ...

プログラミング 2025-05-14に投稿されました