欠測値の処理

実験者としては、行った実験に対して全てのデータが得られることを期待するわけですが、実際には、試料の紛失・実験機の故障等で、データが予定通りに得られない場合があります。

そのような場合、どうしたらよいでしょうか?
いくつかのデータが欠測しているからといって、せっかくのデータを無駄にすることはありません。

とりあえず欠測値の推定を行い、最適条件を推定し、確認実験をしてみることをおすすめします。
最適設計と現行(初期)条件の差分である利得の推定値と確認実験の値はほぼ一致すれば、下流への再現性が確認でき、欠測値がある場合でも、最適条件を決定することが可能です。

欠測値の処理方法には逐次近似法という汎用性の高い方法があります。
今回の講座では、逐次近似法を用いた欠測値の処理方法と欠測値の推定の例題をご紹介したいと思います。

逐次近似法の手順

  1. 欠測値の個所に適当な値(SN比変換できる値)を代入し、とりあえず全てのデータをSN比に変換します。
    (欠測値の処理はSN比に変換した後行います)

  2. 欠測値の個所のSN比(適当な値を代入したSN比)に他の実験bフSN比の平均値を代入し、これを第0次近似値とします。

  3. そのデータを用いて分散分析を行い、推定に使用する効果の大きな要因を選択します。 効果の小さな要因をプーリングして、F値の大きさから推定に使用する因子(半分程度)を選択して下さい。

  4. 次に要因効果図を作成し、欠測値の個所の直交表の水準組み合わせの中で、推定に使用する効果の大きな要因をマウスでクリックすることにより、欠測値のSN比の推定値が計算されるので、これを第1次近似値とします。

  5. 欠測の推定値が収束するまで手順3を繰り返します。(通常は第2次近似値程度で十分です)

「悪すぎて計測できなかった」は欠測値?

「物ができなくて測定ができなかった」「反応がうまく起こらなかったので測定できなかった」など、技術的な理由でデータが得られなかったときは欠測値とは呼びません。

物ができなくて測定ができなかったということは、悪いという貴重な情報だからです。

そのような場合は、他のSN比の平均値を使用するのではなく、SN比の中で一番低いSN比にさらにマイナス3db(分散で2倍悪いと仮定)を第0次近似値として逐次近似法を使用するとよいでしょう。

手順は欠測値の処理と同じです。

補足ですが、
データがよすぎてSN比に変換できない場合も、もちろん欠測値ではありません。たとえば望目特性で、誤差因子の水準を変えても、データが全て同じ値をとる場合や、望小特性でデータがすべてゼロの場合などはSN比は無限大になるためSN比変換ができません。

その制御因子の組み合わせが理想状態ということなので、解析をするまでもなくその条件を最適条件を決めてもよいのですが、各因子の主効果の傾向を一応解析して確認実験を行ってみてください。

その場合は、その実験bフデータを異なった値に修正し、SN比に変換したあと、各実験bフ中で一番高いSN比にさらにプラス3db加えた値を第0次近似として、逐次近似法にて処理をするとよいと思います。

ただし、生データを見て、誤差因子に定性的傾向があるかをもう一度確認してください。
(データのモニタリングを使用するとよいでしょう。)

誤差因子の効果がない場合は、実験を見直す必要があります。

例題1

小型化を目指した新方式のストロボ回路は、充電時間の長さが問題となっている。
充電時間の短縮化のため、次のような制御因子を取り上げ実験を行い、充電時間(秒)を測定した。

制御因子
A.トランス ・・・ 3水準
B.コンデンサ ・・・ 3水準
C.ダイオード ・・・ 2水準
D.オンタイム ・・・ 3水準

電源電圧の劣化に対して、ばらつきをできるだけ減らしたいため、 誤差因子として、新品電池と末期相当の電池を取り上げた。

=新品電池
=末期相当

ダイオードは2種類しか用意できなかったため、ダミー法を用いて、第3水準に第1水準を重複させてわりつけを行った。

《わりつけとデータ》

2.30 3.06
2.01 2.67
2.15 3.12
2.35 3.52
2.17 3.04
2.76 4.10
2.69 4.69
2.06 2.69

実験bTは、計測データを紛失してしまったため、データが記入されていない。

充電時間を望小特性として最適条件を求めよ。

解析手順

  1. 直交表の選択【コンボボックス】

    L9を選択します。

  2. データの新規作成【ファイル(F)】→【新規作成(N)】

    メニューバーから【ファイル(F)】→【新規作成(N)】を選択します。

  3. ファイル名の入力

    ファイル名を入力します。(ここでは「flash」というファイル名にしました。)

  4. 各実験bフデータ数の入力、直交表のわりつけ

    ひとつの実験bフデータ数を入力します。

    この場合、誤差因子が2水準なので、各実験bフデータ数は2になります。 OKボタンをマウスでクリックし、わりつけを終了します。

  5. データの入力【ワークシート】

    ワークシートにデータを入力します。

    実験bTには、SN比に変換できる適当な値を入力してください。
    データ数が多い場合などは、他の実験bフデータをコピーするとよいでしょう。

    ここでは実験bSの値をコピーしました。

    データの入力が終了したら、データを保存します。

  6. SN比変換【SN比(S)】→【ファイル変換(C)】

    メニューバーから【SN比(S)】→【ファイル変換(C)】を選択します。

  7. 欠測値の個所のSN比(適当な値を代入したSN比)に他の実験bフSN比の平均値を代入し、これを第0次近似値とします。

    実験bTに、他のSN比の平均値を代入します。 (実験bP,bQ,bR,bS,bU,bV,bW,bXの平均値を代入します)

    [オプション]メニューから[欠測値の処理]を選択します。

    欠測値の処理をする実験ナンバーを指定します。

    欠測値に代入するデータを指定します。(ここでは平均値を代入するを選択します)

    「OK」ボタンをクリックすると、実験bTに他のSN比の平均値が代入されます

  8. そのデータを用いて分散分析を行い、推定に使用する効果の大きな要因を選択します。

    この例題では、ダミー間誤差と比較して推定に使用する因子(A,B,C,D)を選択しましたが、通常は効果の小さな要因をプーリングして、F値の大きさから推定に使用する因子(半分程度)を選択して下さい。

  9. 次に要因効果図を作成し、欠測値の個所の直交表の水準組み合わせの中で、推定に使用する効果の大きな要因をマウスでクリックすることにより、欠測値のSN比の推定値が計算されるので、これを第1次近似値とします。

    ここでは、直交表の実験bTの水準組み合わせのなかで、推定に使用する効果の大きな要因「A2,B2,C1,D1」をクリックしました。

    実験bTの推定値が要因効果図の下に表示されますので、それを第1次近似値とします。

    [工程平均]メニューから[推定値をコピー]を選択し、その値をコピーし、実験bTに貼り付けます。

  10. そのデータを用いて分散分析表と要因効果図を作成し、上記手順と同様に欠測値の推定を行い、これを第2次近似値とします。

    直交表の実験bTの水準組み合わせのなかで、推定に使用する効果の大きな要因「A2,B2,C1,D1」をクリックします。

    実験bTの推定値が要因効果図の下に表示されますので、それを第2次近似値とします。

    実験bTに、第2次近似値を代入します。

  11. 欠測の推定値が収束するまで上記手順を繰り返します。(通常は第2次近似値程度で十分です)

    ここでは2次近似値「−9.1574」を用いて分散分析表と要因効果図を作成しました。

  12. 最適条件の推定と確認実験を実施します。

    あとは、これまでの講座で説明した通りです。はじめての品質工学セミナーを参照してください。


はじめての品質工学セミナールーム
第一回・・・パラメータ設計のための特性値

第二回・・・因子の分類と一般的な実験の組み方

第三回・・・SN比とその種類

第四回・・・効率的な設計開発を行うために

第五回・・・SN比に変換する前に

第六回・・・動特性それとも静特性?

第七回・・・最適条件を推定してみよう(1)

第八回・・・最適条件を推定してみよう(2)

第九回・・・確認実験は必ず実施しよう

第十回・・・品質評価のためのSN比

第十一回・・・欠測値の処理

第十二回・・・わりつけ(ダミー法と多水準作成法)

第十三回・・・望目特性とゼロ望目特性

第十四回・・・誤差因子の調合

第十五回・・・直交表とその役割

用語集・・・これだけは知っておきたい品質工学用語


品質技術支援サイト ≪HOME≫
RDE