統計データの分類
統計を行う前には、自分が取り扱うデータが以下のどのデータに当たるかをまず確認しなければなりません。取り扱うデータによって、どの検定を行えばよいかが異なってきます。
計量データ
連続データとも呼ばれ、一般的に英語の単位がつくもの)を指します。
(例)AUC、Cmax、身長、体重、血圧など
順位データ
順番に意味はあるが、数字の大きさには意味がないデータを指します。
(例)アンケート→1.良い、2.ふつう、3.悪い、副作用のグレード→grade1, 2, 3, 4
分類データ
名義尺度と呼ばれる。パソコン処理するため、便宜的に入力する数値がそれに当たります。
大小関係のないカテゴリーごとに独立した度数で、カテゴリー変数とも呼ばれます。
(例)性別(男0、女1)、薬の効果(なし=0、あり=1)など
計量データの平均値の比較
1.「一対の比較」の場合
同じグループ内での介入前後の平均値に差があるかないかを検証する臨床試験のデザインです。
正規分布(パラメトリック検定)のときは、対応のあるt検定を用います。正規分布以外(ノンパラメトリック検定)のときは、平均値ではなく、中央値(順位データ)を比較します。ウィルコクソンの符号付順位和検定が使用されます。
2.「2群の比較」
違うグループ間での平均値に差があるかないかを検証する臨床試験のデザインで、実薬とプラセボを比較する試験がこれに含まれます。
正規分布(パラメトリック検定)のときは、t検定を用います。正規分布以外(ノンパラメトリック検定)のときは、マンホイットニーのU検定(ウィルコクソンの順位和検定と同じ)を使用します。
優越性試験と非劣性試験
優越性試験とは、対照薬と比べて優れているかを検証する試験を指し、プラセボとの比較試験になります。しかし、プラセボ群に割り当てられた人は治療する機会を失ってしまうことになり、倫理的に問題を生じます。
また、治療薬が既に開発され臨床使用されているとすると、対照薬がプラセボと比較して効果があったとしても、他の治療薬に比べてどのくらい優れているか比較することができません。
そこで、被験者の治療機会を失わせることなく、既存の治療薬と比べて劣っていないかどうかを確認する試験が行われます。この試験を非劣性試験といいます。非劣性試験は新薬の効果が標準薬の効果より劣っていないかどうかを検証します。これまでの同等性試験のほとんどは非劣性試験にあたり、最近の臨床研究では多く実施されています。
【優越性試験】
アステラス製薬における過敏性腸症候群治療薬イリボー錠の女性への適応追加申請の例
【概要】
下痢型過敏性腸症候群治療薬イリボー錠およびイリボーOD錠(一般名:ラモセトロン塩酸塩)について、「女性における下痢型過敏性腸症候群」の適応を追加する申請を行った。これまでは2008年に「男性における」のみの適応で発売となっていた。
【結果】
主要評価項目である過敏性腸症候群症状の全般改善効果の最終時点における月間レスポンダー率(=下痢の改善率)に関して、
男性では、イリボー錠5μg群はプラセボ群を上回り、有意な差が認められた。
女性では、イリボー錠5μg群はプラセボ群に対して、有意な差を示さなかった。
【検定】
取り扱うデータは名義(分類)データでカテゴリー変数ですので、検定はχ2検定を用います。
名義データは、男女、病気発症の有無などで、例えば男0、女1や効果あり0、効果なし1と便宜上数値化して解析を行いますが、数字自体に意味はありません。そのため、名義データで平均値や中央値を出して解析することはできません。
χ2検定は、男女比や発症率といった2群の比にあるかないかを検定する手法で、t検定と同様にどちらがどの程度高いといった程度や方向を知ることはできません。
これを解決するために、相対リスク(相対危険度)、オッズ比が使用されます。
2群間のイベントの発生率の比(割合)には相対リスクとオッズ比があり、研究デザインによって使い分けます。対象者を時間経過とともにイベントの発生を追跡していく前向き研究場合は、相対リスクを使用します。
過去にさかのぼって要因の影響を検証する後ろ向き研究の場合は、相対リスクを近似的に求めるオッズ比が使用されます。
【リスクとは?】
リスクは危険度ともいい、ある危険因子をもつ人や危険因子に曝露した人に将来、特定の疾患や症状などが発生するする確率のことをいいます。(例)死亡、心血管イベントなど
今回の研究については、下痢症状が改善しない=リスクとしています。
【イリボーを服用した男性の解析結果】
イリボーを服用した211名のうち、112名で効果がなかったため、
イリボーのリスクは、112÷211=0.531
同様にプラセボを服用した223名のうち、169名で効果がなかったため、
プラセボのリスクは、169÷223=0.758
相対リスクとは、ある状況下にある人が、その状況下にいない人に比べてどのくらいリスクを発現しやすいかを倍数で示したものです。相対リスクが高いほど、ある状況下にいる人が、その状況下にいない人に比べて、リスクを発現する確率が高いと解釈します。
今回の場合に当てはめて相対リスクを解釈すると、
イリボーを飲んで下痢が改善しなかった人(ある状況下にある人)が、プラセボを飲んで下痢が改善しなかった人(ある状況下にいない人)に比べて、下痢症状を改善する効果がない(リスクを発現する確率)確率が○○倍高いと解釈します。
相対リスクを算出すると、0.531÷0.758=0.70(95%信頼区間 0.60‐0.81)となります。
これにより、イリボーにより下痢のリスクが70%になるということができます。ちなみに相対リスクが1ということは両群で差がないことになります。
下痢のリスクが70%であったため、残りの30%で下痢のリスクは減ったと考えることができます。これを相対リスク低下といい、1-0.70(相対リスク)=0.30となります。これからイリボーにより下痢のリスクが30%減ったということになります。
今回の結果から0.531/0.758で下痢のリスクが30%減ったとなりましたが、0.0531/0.0758であっても計算結果は30%という結果となります。30%という結果が同じであっても、臨床上では大きな誤解を招きやすい結果となってしまいます。
そこで、絶対リスク低下を使用します。絶対リスク低下は両群のリスクの差で、その投薬によってどのくらいの絶対リスクを下げるのかを知ることができます。
絶対リスク低下は、0.758-0.531=0.23となり、イリボーにより下痢のリスクが23%減少したと解釈することができます。
NNT(number needed to treat)は治療必要数(NNT)は一人のリスクを減らすために必要な治療患者数をいい、NNTが小さいほど治療効果が大きいと判断されます。
NNTは絶対リスク低下の逆数で算出することができます。1÷絶対リスク低下=4.34となり、4.4人がイリボーを服用すると1人は下痢にならないと解釈されます。NNTがいくつ以下なら意味があるかは、疾患の種類、罹患率、重症度などによるため、それぞれの臨床的枠組みの中で決定されます。