ROC曲線とC統計量(c-statistic)

c統計量というのがあるらしい。
正誤の判別をするときに用いる指標で、元データが大きく偏ったりしているときでも使える指標らしい。

ということで、色々調べておりましたが、先日とうとう専門家に問い合わせて、分かりました。

ROC曲線の下側の面積なのですね。
ロジスティック回帰分析による確率的・連続的値を元に正誤判別をするとき、正しい判別率がどの程度か、を指標化したグラフの面積なのですね。

私の今のデータに直接使えないことは分かりました。
いや、やり方によっては使えるのか・・・

ともかく、分かりました。

なぜ日記に書いたかというと、”c統計量”で検索してもほとんど出てこないからだ。かなり困った。
ROC曲線、という第二ヒントがなければ出てこなかったなぁ。

分野で言うと医療統計のあたりでよく使われているらしく、専門家によるとc>0.8ならよい、という目安があるそうな。なるほど。

で、Rでないかな、とおもったら、青木先生が書いておられました。さすが。
R — ROC 曲線と ROC 曲線下面積

日記
誕生日メモ

娘が「牛乳買って。飲まないんだけど」という。 なんで飲まないもんを買うんだ(笑)と返事したら、少し困 …

日記
今年の10大ニュース2019

今年も大晦日になりました。今年もいろんな人に遊んでもらって、感謝しています。例によってぼんやり今年を …

日記
安定した環境を!

MacOS新しいのが出ましたね。Catalina ですか。Sidecarを試してみたくて、自宅のマシ …