ROC曲線とC統計量(c-statistic)

c統計量というのがあるらしい。
正誤の判別をするときに用いる指標で、元データが大きく偏ったりしているときでも使える指標らしい。

ということで、色々調べておりましたが、先日とうとう専門家に問い合わせて、分かりました。

ROC曲線の下側の面積なのですね。
ロジスティック回帰分析による確率的・連続的値を元に正誤判別をするとき、正しい判別率がどの程度か、を指標化したグラフの面積なのですね。

私の今のデータに直接使えないことは分かりました。
いや、やり方によっては使えるのか・・・

ともかく、分かりました。

なぜ日記に書いたかというと、”c統計量”で検索してもほとんど出てこないからだ。かなり困った。
ROC曲線、という第二ヒントがなければ出てこなかったなぁ。

分野で言うと医療統計のあたりでよく使われているらしく、専門家によるとc>0.8ならよい、という目安があるそうな。なるほど。

で、Rでないかな、とおもったら、青木先生が書いておられました。さすが。
R — ROC 曲線と ROC 曲線下面積

日記
自粛生活日記07/09

だらだら書くよ。飲んでるからね。     自粛生活も三ヶ月ぐらいになりますかね。 …

日記
insideな毎日

授業が始まった。最初は不安もあったし,学生はどう受け止めるんだろう,と思うことも多かったが,開始から …

日記
いよいよだぞぅ

「気を緩めては行けない」らしいけど、新規の罹患者数も2桁、50人以下の日々も続いて、そろそろ出口が見 …