Weka

インストール

2020年9月現在、Java SE Development Kit(JDK)の最新版は14.0.2、Wekaの最新の安定版は3.8.4。Javaはランタイム(JRE)だとメモリをあまり使ってくれないらしく、大規模データだと動いてくれない。

データ読み込み

ARFF形式のファイルを作る必要。%でコメント。ヘッダ部分は以下のように書く。

@relation dataname
@attribute column-1 integer
・・・
@attribute column-n integer
@data
・・・

「@relation」の後ろにデータの名前を適当に書く。「@data」以降にデータをカンマ区切りで置く。 「@attribute」は変数名(上の例では「column-1」とか)と変数の属性(上の例では「integer」)を書く。

  • 使用できる属性
    • numeric:任意の数値。
    • real:実数。
    • integer:整数。
    • nominal:変数の値が文字列のとき、取りうる値を{value1, value2, value3, ...}のように列挙(例:@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica})。「nominal」とは書かなくていい。
    • string:任意の文字列。テキストマイニングのとき使う。
    • date:日付。「"2001-04-03 12:12:12"」のような時には「@ATTRIBUTE timestamp DATE "yyyy-MM-dd HH:mm:ss" 」のように書く。
  • arffファイル作成時の注意
    • 欠損値は「?」で表記すると読み込める(分析できるかは別)。
    • BayesNet?を使う場合、属性はnominalのみ?

ベイジアンネットワーク

トラブル


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-09-11 (金) 10:46:57 (660d)