- Home
- >
- 判定法と用語の説明
判定法と用語の説明
統計
標準偏差と偏差値
ともに、ばらついているデータの分布の程度を表します。例えば、20歳の男性100人の体重を計って分布を求めます。分布は取りあえず2kg刻みで見てみましょう。50kg~52kg、52kg~54kg、54kg~56kg …… の各々の区間に何人入るか、数えてみるわけです。平均値は必ずしも中央の値になるわけではありませんが、大体真ん中の値です。体重が低い側と高い側が対称的に分布しているなら(ここのところは仮定です)分布の真ん中が平均で、平均値の近くに沢山の人がいて、平均値から離れた体重の人は少ないはずです。(ここでも注意が必要です。性別を区別せずに20歳の男性100人、女性100人合計200人の分布を見ると、平均値と分布の形はどうなるでしょう? このとき男女混合の平均値から外れたところに、男性の分布のピークと女性の分布のピークが見られるはずですね)このような分布の形をある程度理想化して数学的な式で表すことができます。正規分布もしくはガウス分布と言われるものです。
標準偏差は、このような分布を仮定したときのばらつきの幅の指標で、平均値を中心に(平均値-標準偏差)~(平均値+標準偏差)の範囲に入る人の割合は、およそ68.26%になります。さらに
(平均値-2×標準偏差) ~ (平均値+2×標準偏差)
(平均値-3×標準偏差) ~ (平均値+3×標準偏差)
の範囲に入る人の割合は、それぞれ95.44%、99.73%になります。
ここで体重の大きい人だけを問題にしてみます。上のような分布の割合から(平均値+標準偏差) 以上の体重を持つ人の割合を求めると、15.87% (100人中16人程度)になります。同様に、
(平均値+2×標準偏差) 以上の体重を持つ人の割合は、2.28% (100人中2人程度)
(平均値+3×標準偏差) 以上の体重を持つ人の割合は、0.14% (1000人中1人程度)
となります。
さて、先ほど注意点として男女混合の分布ではなく、男女別にしてみる必要性を少し述べました。「20歳の男性」と年齢を指定したのも同じ理由です。40歳の女性を、ここで調べた20歳の男性の分布を基準にやせているとか太っているという判断はできません。平均値は当然異なっているはずですし、標準偏差も違うはずです。例えば、20歳男性の標準偏差は8Kgで、40歳女性の標準偏差は14Kgかも知れません。(調べてみたわけではありません、あくまで仮定です)ここで標準偏差を基準にすることの威力が発揮されます。標準偏差の1.5倍体重の大きい人は、
20歳男性では62+1.5×8=74Kg、
40歳女性では49+1.5×10=64Kg
になりますが、この両人はどちらも標準偏差を基準にした正規分布で同じ位置にいます。ここで、男女別年齢別のどのグループの分布も平均値を50、標準偏差を10として換算します。この換算値が「偏差値」です。上の例では両人とも偏差値は 50+1.5×10=65 となります。[測定値] と [平均値] 及び [標準偏差] から直接計算すると、
[偏差値]=50+10×([測定値]-[平均値])/[標準偏差]
となります。
この計算式では、体重の偏差値を求めていますので、体重が大きくなるほど偏差値が大きくなります。
※血管老化偏差値について
アルテットのソフトでは、波形指数Ⅰから、血管老化偏差値を算出していますが、血管老化が進むと、この波形指数Ⅰは小さくなります。波形指数Ⅰの値が小さくなるほど血管老化偏差値が大きくなるわけです。従って、血管老化偏差値を求める式は、つぎのようになります。
[血管偏差値]=50+10×([平均値]-[波形指数測定値])/[標準偏差]
多重ロジスティック分析 ─ 動脈硬化リスクの判定法について
動脈硬化進行の要因として、喫煙や食生活などの様々な生活習慣の影響が言われています。そして、生活習慣に加えて肥満度や血圧など様々な健診値から個人の現在の健康状態について評価し、動脈硬化の程度や今後進行する可能性がどれくらいあるか数字で表せると便利です。このようなことを検討するための道具が統計学の中の多変量解析という分野で、なかでも近年、外国の論文に多重ロジスティック分析が増えてきています。
加速度脈波の波形と他の測定法による動脈硬化所見との相関が見られると、簡単な脈波測定から動脈硬化の一次スクリーニングができて便利です。加速度脈波のa波の波高値で規格化した、四つの波形特徴量 b/a、c/a、d/a、e/a について、以前から b/a と d/a との動脈硬化の関連は認められていましたが、c/a に付いては、議論が分かれていました。ここで、b/a と d/a 及び被験者の年齢から計算される score 1 と、b/a と c/a 及び被験者の年齢から計算される score 2 について、各々の値が高い場合(60以上 ; 表中+と表記)と低い場合(60未満 ; 表中-と表記)の四つの組み合わせについて、被験者の一般的な動脈硬化所見(大動脈弓突出、高血圧、眼底動脈硬化)との相関を見た結果が、下の表です。
大動脈弓突出所見(胸部写真)との関連
対象について、大動脈弓突出所見とハイスコアとの関係を多変量解析で示した分析結果です。血管老化度[1]および[2]の、どの組み合わせが最も大動脈弓突出所見と関連するかを検討したものです。これによると血管老化度[1]だけが高い場合に、最も高い関連性が見られます。オッズ比は約2倍です。
胸部写真 左第一弓突出所見あり
表内一番右の p-value は、結果が意味のない確率で、p<0.01 ということは、結果が無意味である(偶然起こる)確率が100に一つより小さいということですから、結果の確からしさが99%以上と言うことです。n.s. は、no significant の略で、有意ではないということです。
Odds ratio (オッズ比)は、検査結果に対して動脈硬化所見が見られる確率から計算され、1より大きいほど、確率が高くなります。
B と SE は、数字の確からしさを示す値で、専門家が結果の信頼性を評価する時に検討します。
c/a の値と動脈硬化所見に相関があるならば、score 2 が高い(+)時、Odds ratio も高くなることが期待されます。ところが結果はそうなっていません。例えば、全ての動脈硬化所見について、score 1 と score 2 が両方とも(+)であるよりも、score 1 が(+)で score 2 が(-)の時のほうが Odds ratio が高くなっています。この結果から、score 2 つまりは c/a を動脈硬化リスク判定に含めないこととしました。
周波数解析
周波数-脈拍と脈拍変動の表現
ある量が時間と共に変化しているとき、一定時間に生じる変化の数が周波数です。一般に、1秒間に変化する数をHz(ヘルツ)で表します。
1分間脈拍を測定して脈拍数が100(つまり1分間に100回の拍動)であったとします。脈拍を脈圧の変化としてとらえると、このときの脈拍の周波数は60秒間に100回の脈拍ですから、100回/60秒=1.33Hzとなります。
ここで、脈と脈の時間間隔(脈拍間隔)を考えてみます。60秒間に100回の脈拍ですから、脈拍間隔は 60/100=0.6秒=600msec となります。ところが脈拍変動は、一拍ごとの脈拍間隔が一つずつ変化するという事実に基づくわけですから、この脈拍間隔はあくまで平均的なものです。
先ほど、脈拍の周波数を求めましたが、このとき、変化しているのは脈の拍動を表す脈圧の変化でしたが、ここで、脈拍間隔という量の変化を考えます。
平均的な脈拍間隔を中心に、個々の脈拍間隔が平均より長くなったり短くなったりの変化が、100拍の間に20回繰り返していたとします。このとき 100/20=5拍を一周期として、脈拍間隔が変動していることになります。先ほど脈拍間隔の平均的な値を0.6秒としましたから、5×0.6秒=3秒を一周期として変動していることになります。周波数Hzに換算するためには、周波数の定義に従って、一秒間に何回変化するかを求める必要があります。ここでは、3秒に一回ですから、1秒に何回も変化するわけではありません。変化する割合で考えると、1秒に変化する割合は1/3回ですので、周波数は、0.333Hzとなります。
MEM
MEM は Maximum Entropy Method (最大エントロピー法)のことで、パワースペクトルを算出する手法の一つです。フーリエ変換と比較して、より少数のデータからピーク位置が明瞭に検出できる特徴があり、近年、生体リズムの解析に多く用いられています。フーリエ変換は時系列データを直接周波数変換し、時系列データ相互の関連性には依存しません。
これに対して、時系列データ相互の関連性に自己回帰モデルなどの線形モデルの当てはめを行うことにより、パワースペクトルを求める手法があります。MEMはこのような手法の一つです。この手法では、現在のデータを過去のデータの線形和の形で予測します。そして、この予測式に用いる過去のデータの数が次数です。この予測式による予測値からの誤差の程度を評価してその評価値が最小(FPE : Final Prediction Error)になるときの次数が、自動算出されたシステムモデル(予測誤差フィルター)の最適次数です。
MEMの次数決定は、実用的にいくつかの問題点があり、小さすぎる場合や大きすぎる場合は、推定されるスペクトルが適切なピークを示さないことがあります。このような場合、自動算出を外して6から20の範囲で再計算すると良いようですが、LF/HF の値については、大きな違いはないようです。
デフォルトでの周波数解析は、横軸が正確な時間ではなく、脈拍のカウントに a-a 間隔の平均値を掛けた値を時間軸として計算しています。厳密にはa波の発生時間を時間軸とすべきですが、そうすると a-a 間隔のプロットは等間隔になりません。そこで等間隔にリサンプリングして計算する機能を設けてあります。リサンプリングする前にデータをスプライン関数で補間しますが、スプライン関数の次数と滑らかさのパラメータが指定できます。また、計算の速度を重視するか精度を重視するかにより、計算法が選択できます。
※結果画面の見方
パワースペクトルを、0.02Hz から(From)、0.15Hz まで(To)積分してLF (Low Frequency) のパワー値を、0.15Hz から、0.5Hz まで積分してHF (High Frequency) のパワー値を算出します。この設定数値を変えることにより、積分する周波数範囲を変更することができます。%値は、Total power (全周波数範囲積分値)に対する割合です。
※測定時間の影響について
心拍変動は、長い周期まで見るとf分の1ゆらぎの周波数特性を示すといわれ、長期間観察すればそれだけ長い周期(低い周波数)の、より大きな変化が見られるようになります。LFの最低周波数 0.02Hz は50秒周期ですが、一分の測定では限界の精度と考えられます。更に低周波数領域の研究も盛んに行われているようです。HFでの検出対象は、主に呼吸周期に相関する部分、LFでの検出対象は、主に10秒から30秒程度の周期の、血圧変動に相関する部分とされています。