事例: DOEとタグチメソッド

先日、DOE(Design of Experiments)とタグチメソッドの比較に都合の良い事例に巡り合いました。そこで前回の投稿に引き続き、DOEとタグチメソッドのついて書いてみたいと思います。

ロバスト設計と最適化

今回扱うのは「ロバスト設計と最適化」の典型的な事例です。4つの要因(または制御パラメータ)を使って、ノイズ要因に対する出力のバラツキ(標準偏差)を最小限にし、平均値を目的の値に近づけるというものです。

4つの要因と値は

  • BCT(連続値: Continuous Value)15から60
  • RCT(連続値: Continuous Value)90から180
  • FAN(属性値: Attribute Value)YESまたはNO
  • TMP(連続値: Continuous Value)300から320

そしてノイズ要因と値は

  • P(離散値: Discrete Value)P1からP8

これらの値の組合せを使って、出力の値(バラツキ/標準偏差と平均値)を最適化しました。その際DOEとタグチメソッドを比較して、どちらが良い結果をもたらすのか、ということを試してみました。

DOEとタグチメソッドの設計モデル

さてここからがMinitabの出番です。まず設計モデルを確認し、テストケースを含むデータ・テーブルを作成しました。

DOEは最もシンプルな完全実施要因計画(Full Factorial Design)を選択し、16個のテストケースを作りました。制御パラメータとテストケースの数がDOEと同じになるように、タグチメソッドは4要因2水準のL16直交表を選択し、同じ様に16個のテストケースを作りました。

設計モデル

Minitabが自動的に生成したデータ・テーブル(制御因子-内側配列)を拡張して、ノイズ因子(外側配列)を付けました。この内側配列と外側配列はDOEもタグチメソッドも同じなので、 データ・テーブル を共有しました。

そして内側配列のテストケース(制御因子)とノイズ因子に従ってテストを実施し、出力データを取得しました(合計128データを取得)。

データ・テーブル1

128個のデータを取得した後、さらにMinitabを使ってこのデータ・テーブルを分析し、以下の情報を取得しました。

  • S/N比(タグチメソッドのみ)
  • 標準偏差(DOEとタグチメソッドは同じ値)
  • 平均値(DOEとタグチメソッドは同じ値)
  • 平均値と標準偏差の数値モデル(DOEとタグチメソッドで違う数値モデル)

MinitabはタグチメソッドのみS/N比を自動出力しますが、DOEの場合は計算式を手入力することで同じ値を得ることができました。

興味深いことに、Minitabが生成する数値モデルはDOEとタグチメソッドでは全く異なり、その違いが「ロバスト設計と最適化」の結果にも影響を与えました(後述)。

データ・テーブル2

主要因分析

平均値を決める主要因は、DOEとタグチメソッドに違いが出ました。DOEは平均値を求めるためにBCTは重要ではない(主要因ではない)と判断し、主要因分析グラフからBCTを除きました。実際DOEが生成した平均値の数値モデルにはBCTは入っていません(これは数値モデルのオーバー・フィッティングを防ぐために重要)。

平均値の主要因分析グラフはDOEとタグチメソッドで異なりましたが、一方標準偏差の主要因分析グラフは同じであり、またS/N比の主要因分析グラフはタグチメソッドだけの表示となりました。

主因子分析(Main Effect Analysis)1

ただ制御要因の相互作用(Interaction)はDOEとタグチメソッドでは異なりました。これはMinitabが生成した数値モデルとの関係があります。

僕の理解では、タグチメソッドは制御因子の相互作用は扱わないはずですので、MinitabがタグチメソッドでもDOEと同様に制御因子の相互作用を扱ってくれることは、タグチメソッドをMimitabで使う上で大きなボーナス・ポイントかもしれません。

主因子分析(Main Effect Analysis)2

DOEの主要因分析は、相互作用を含めて、効果の強度をパレート図で表示してくれます。この図を見れば、どの制御要因(相互作用を含めて)が重要で、どれが重要ではないのか、ということが一目瞭然となります。

主因子分析(Main Effect Analysis)

残差(Residual)分析

残差(Residual)に関しては、その範囲はDOEもタグチメソッドもほとんど変わりがありませんでした(DOEの方が少し良い)。

しかしDOEの平均値の残差にはあるパターンが見られました(散布図)。これは平均値を求める数値モデルが線形ではなく、非線形モデルである可能性を示しています。今回のDOEはFactorial Designを使ったので数値モデルは線形ですが、時間があればDOEのCentral Composite Designを使って、もっと正確な非線形の数値モデルが作れたと思います。

様々な統計的テクニックを使ってより正確に対象システムを数値モデルとして理解できるところが、DOEの優れた点です。

残差(Residual)分析

回帰分析

回帰分析の結果はDOEとタグチメソッドで大きな違いが出ました。DOEはFANを除く制御要因を連続値(Continuous Value)として扱ったため、決定係数(R Squared Value)がタグチメソッドよりも高くなりました。

一方タグチメソッドはすべての制御因子を二値(1か0)で扱っているため、決定係数(R Squared Value)はDOEに比べると良くありませんでした。

そもそもタグチメソッドは、出力のバラツキが最も少なくなるような制御要因の組合せを見つけるための方法なので(僕の理解では)、回帰分析はMinitabのおまけ(ボーナス)機能なのかもしれません。

回帰分析(平均)
回帰分析(標準偏差)
回帰分析(S/N比)

予測(Prediction)

Minitabには回帰分析で生成した数値モデルを使った予測(Prediciton)機能があります。その機能を使って、DOEとタグチメソッドで予測結果がどのように違うのかを比べてみました。違う制御条件で新しいデータを取得することはしなかったので、代わりに実際に取得したすでにあるデータを使って予測値を比べました。

例えばBCT = 15、 RCT = 90、 FAN = YES、 TMP = 300の時、実際に取得したデータの値は、

  • S/N比 = 8.37280
  • 標準偏差 = 343.339
  • 平均 = 900.250

でした。それに対してDOEが予測した値は、

  • 標準偏差 = 328.321(95% PI = 252.759 – 403.883)
  • 平均値 = 876.875 (95% PI = 607.300 – 1146.45)

でした。またDOEはPI(Predict Interval)も表示してくれました。

一方タグチメソッドが予測した値は、

  • S/N比 = 8.59658
  • 標準偏差 = 303.599
  • 平均 = 828.672

となりました。DOEが予測した値の方がタグチメソッドが予測した値よりも実際のデータに近かったようです。また95% PIを計算してくれるところが、DOEのもう一つの利点です。

繰り返しになりますが、そもそもタグチメソッドは、出力のバラツキが最も少なくなるような制御要因の組合せを見つけるための方法なので(僕の理解では)、回帰分析やそれを使った予測はMinitabのおまけ(ボーナス)機能なのかもしれません。

一方DOEは回帰分析やそれを使った予測や最適化が主な目的なので、この結果の違いは当然と言えば当然です。

予測(Prediction)1
予測(Prediction)

最適化(多目的最適化)

DOEは連続値(Continuous Value)を用いた数値モデルを生成するので、それを使った最適化を行うことができます。例えばここでは次の条件で多目的最適化を行ってみました。

  • 標準偏差を最小化
  • 平均値の値を300にする
  • 標準偏差の最小化の方が、平均値を300にするよりも、2倍重要

Minitabを使うことでこのような最適化が簡単に行えました。最適化の結果

  • BCT = 60
  • RCT = 105.413
  • FAN = No
  • TMP = 319.998

にすることで、

  • 標準偏差 = 149.2187(95% PI = 78.4 – 220.0)
  • 平均 = 300(95% PI = 43.5 – 556.5)

になることを予測することができました。後は実際のテストでこの最適化の結果を確かめるだけです。

最適化(平均と標準偏差の多目的最適化)1
最適化(平均と標準偏差の多目的最適化)2

モンテカルロシミュレーション

DOEの場合、連続値の数値モデルを生成してくれるので、それを使ってモンテカルロシミュレーションを行うことができました。制御因子にランダム変数を割り当て、シミュレーションすることで、出力のバラツキ具合は確認できます。

出力に要求仕様(上限値と下限値)があれば、それらの値を使って要求を満たさない確率(Probability of Non-Conformance: PNC)を求めることができます。PNCは製品の品質を図るうえで重要な指標(インデックス)となるので、モンテカルロシミュレーションを行うことができるDOEは非常に優れています。

モンテカルロシミュレーション

まとめ

最適な制御因子の組合せを簡単な計算だけで求めることができるタグチメソッドはとても優れています。特に制御因子が属性データであったり離散データの場合は有効です。コンピュータや電卓がなかなか使えなかった1940年代にこの方法が開発されたということに、改めて驚きます。

またタグチメソッドが属性データや離散データを扱うことから、最近ではソフトウェアのテストで使われるようになってきたことも納得できます。

しかし制御因子が連続データの場合は、DOEの方が遥かに強力で正確かもしれません(属性データや離散データの場合は少なくともタグチメソッドと同様)。そしてMinitabのようなソフトウェアを使えば、あっという間に最適値を得ることができます。

日本では実験計画法と言えば即ちタグチメソッドですが、どうしてもっと早くて正確なDOEが普及しないのか、その理由が良く分かりません。もしお金を出してMinitab等のソフトウェアを使うのが嫌なのであれば、無料のPythonやRでも同じようなことができます。僕からは一度DOEを検討してみることをお薦めします。