株式会社オートプロジェクト

Columnコラム
2015年6月3日
k近傍法

機械学習アルゴリズムの中で、最もシンプルと言われる分類方法。

下記のように、赤、青、緑とグループ分けされた状態で、がどのグループに存在するかを見つける。例えば、最も近い3点から選択するという方法をとる場合、下記の図のように、印は、緑に属することになる。

f4a7838e

最も近い点を何点選ぶかは、任意で選択可能。sc kit learnによる処理速度も比較的早い。

 

・sckit learnでの実装

※features_train、 labels_train、features_test は別で定義済。

from sklearn.neighbors import KNeighborsClassifier
clf = KNeighborsClassifier(n_neighbors=3)
clf.fit(features_train, labels_train)
predict = clf.predict(features_test)

※n_neighbors=3 の箇所で何点を選ぶかを選択できる。

パラメーターやメソッドの詳細はこちら

http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.NearestNeighbors.html#sklearn.neighbors.NearestNeighbors