ROC曲線とC統計量(c-statistic)

c統計量というのがあるらしい。
正誤の判別をするときに用いる指標で、元データが大きく偏ったりしているときでも使える指標らしい。

ということで、色々調べておりましたが、先日とうとう専門家に問い合わせて、分かりました。

ROC曲線の下側の面積なのですね。
ロジスティック回帰分析による確率的・連続的値を元に正誤判別をするとき、正しい判別率がどの程度か、を指標化したグラフの面積なのですね。

私の今のデータに直接使えないことは分かりました。
いや、やり方によっては使えるのか・・・

ともかく、分かりました。

なぜ日記に書いたかというと、”c統計量”で検索してもほとんど出てこないからだ。かなり困った。
ROC曲線、という第二ヒントがなければ出てこなかったなぁ。

分野で言うと医療統計のあたりでよく使われているらしく、専門家によるとc>0.8ならよい、という目安があるそうな。なるほど。

で、Rでないかな、とおもったら、青木先生が書いておられました。さすが。
R — ROC 曲線と ROC 曲線下面積