ゲージR&Rの判定基準と繰返し性・再現性を正しく理解する方法
校正済みの測定器でも、%GRRが30%を超えたまま使い続けると不良品を流出させてクレームが起きます。
ゲージR&Rの判定基準となる%GRRの意味と3段階評価
ゲージR&R(Gage Repeatability and Reproducibility)は、測定システム全体のばらつきを定量的に評価する手法です。金属加工の現場では、ノギスやマイクロメータ、三次元測定機など多様な計測器が日常的に使われていますが、機器を定期校正しているだけでは「測定システムが信頼できるかどうか」は判断できません。
最も重要な評価指標が%GRR(パーセント・ゲージ・アール・アンド・アール)です。これは、測定全体のばらつき(TV:Total Variation)に占める、測定システム由来のばらつき(GRR)の割合を示します。
| %GRR | 判定 | 対応 |
|---|---|---|
| 10%未満 | ✅ 合格 | そのまま使用可 |
| 10〜30% | ⚠️ 条件付き合格 | コスト・顧客要求に応じて判断・改善検討 |
| 30%超 | ❌ 不合格 | 測定器点検・手順見直し・教育が必須 |
この基準はAIAG(米国自動車産業アクション・グループ)が策定したMSA第4版に由来しており、IATF16949(自動車産業向け品質マネジメント規格)でも準拠が求められています。
%GRRが30%を超える状態では、測定値のうち3割以上が「測定システムのせい」で発生しているばらつきです。これは、公差0.1mmの部品に対してノギスが±0.03mm以上ブレているような状態に相当します。この状態で合否判定をしても、良品と不良品の区別が測定のノイズに埋もれてしまいます。
つまり%GRR10%未満が条件です。
現場では「10%は厳しすぎる」と感じることもあるかもしれません。しかし、%GRRが大きいまま工程能力指数(Cpk)を計算しても、測定ばらつきが乗った数値が出るため、工程の実力が正確に評価できません。品質保証の「入口」として、まず測定システムの信頼性を確認することが大前提です。
参考:ゲージR&Rの判定基準や%GRRの計算方法を、IATF16949の文脈でわかりやすく解説しているサイト
GR&R | AIAG/VDA | MSA|工程能力 | Cp/Cpk(銀河モーター)
ゲージR&Rの繰返し性(EV)と再現性(AV)の違いと改善の方向性
ゲージR&Rでは、測定システムのばらつきを2つの要素に分解します。一つは繰返し性(EV:Equipment Variation)、もう一つは再現性(AV:Appraiser Variation)です。%GRRが悪化しているとき、どちらが原因かを特定することが改善の第一歩になります。
繰返し性(EV) は、同じ測定者が同じ部品を同じ条件で複数回測定したときのばらつきです。これは主に測定器そのものの能力、あるいは治具の固定精度など、ハードウェア側の問題を反映します。
再現性(AV) は、異なる測定者が同じ部品を同じ測定器で測定したときの、測定者間の平均値のばらつきです。これは測定者ごとの持ち方・押しつけ力・手順の理解度といったソフトウェア的な要因を反映します。
| 指標 | 主な原因 | 効果的な改善策 |
|---|---|---|
| EV(繰返し性)大 | 測定器の摩耗・劣化、治具のガタつき、分解能不足 | 校正・オーバーホール、治具の改良、より高精度な測定器への変更 |
| AV(再現性)大 | 測定手順の不統一、測定者のスキル差、測定ポイントの曖昧さ | 測定SOP(標準作業手順書)の整備、測定者教育、図面上の測定箇所明記 |
よくある誤りは、%GRRが悪いと反射的に「測定器を変えよう」と判断してしまうことです。しかし、AVが原因の場合は測定器を変えても改善されません。むしろ手順書の整備や測定者全員への教育で、コストをかけずに改善できるケースも少なくありません。
EVとAVを確認すれば原因がわかります。
%GRRが30%超でも、まずEVとAVの比率を見て「どちらが支配的か」を確認することが重要です。例えば金属部品の外径測定でAVが全体の8割を占めていたなら、治具改良より作業標準の見直しのほうが先決です。逆にEVが大きい場合は、測定器の分解能が公差の1/10以下になっているか確認してください。公差0.1mmの検査なら、測定器の最小読取値は0.01mm以下が原則です。
厳しいところですね。ただ、この切り分けができれば改善コストと効果が大幅に改善します。
参考:繰返し性・再現性の違いと、%GRRが悪いときの具体的な改善アクションを詳細に解説
ゲージR&Rとは?基礎知識や導入メリット、実施の手順まで解説(TMCシステム)
ゲージR&Rの判定基準として見落とされがちなndc(知覚区分数)の重要性
%GRRだけ見て「合格」と判断しても、もう一つの指標が不合格なら測定システムとして失格です。それがndc(Number of Distinct Categories:知覚区分数)です。
ndcは「この測定システムで製品のばらつきを何段階に区別できるか」を示す指標で、次の式で計算します。
PV:部品間のばらつき(標準偏差) GRR:測定システムのばらつき(標準偏差)
ndcが5以上であれば合格とされています。5以上とは「製品の品質レベルを5段階以上に識別できる」状態を意味します。わかりやすく言えば、製品の良品・不良品の差を測定システムがきちんと捉えられているかどうかのチェックです。
ndc5以上が条件です。
ndcが5未満の場合、たとえ%GRRが10%台であっても、測定システムは製品差を十分に識別できていないことになります。これは検査工程での見落としリスクに直結します。
| ndc | 判定 | 意味 |
|---|---|---|
| 5以上 | ✅ 合格 | 製品差を十分に識別可能 |
| 5未満 | ❌ 不合格 | 識別能力不足・品質判定に支障あり |
ndcが低くなるのは、GRR(測定システムのばらつき)に対してPV(部品間のばらつき)が小さすぎるときに起こります。これはサンプル選びに問題があるケースが多いです。
具体的には、10個のサンプルが規格中央付近に集中していると、PVが人工的に小さくなり、ndcも低くなります。金属加工品のゲージR&Rでは、意図的に「小さめ・中くらい・大きめ」を混ぜて公差範囲全体をカバーするサンプルを用意することが必要です。部品のばらつきをあえて広くとることで、測定システムの実力がより正確に評価できます。
参考:ndcの意味と計算方法、%GRRとの関係を日本品質管理学会のQ&A形式で解説
ゲージR&Rの「ndc」の意味(日本科学技術連盟・統計サポートFAQ)
ゲージR&Rの計算方法:平均範囲法とANOVA法の使い分け
ゲージR&Rの計算には大きく2種類の方法があります。現場ではどちらを使うかで結果の精度と対応できる分析の深さが変わります。
平均値-範囲法(X̄-R法) は、各測定者・各部品の測定範囲(最大値−最小値)を使った計算方法で、ExcelのAVERAGE関数とMAX・MIN関数だけで再現できます。AIAGのMSAマニュアル第4版に掲載されている標準的な手法で、統計ソフトがない現場でも実施しやすいというメリットがあります。一方で、「部品と測定者の交互作用」(特定の部品を特定の測定者が測ると測定値がズレる現象)は評価できません。
ANOVA法(分散分析法) は、二元配置分散分析を使って測定データを「測定器要因・測定者要因・部品要因・誤差」に分解する方法です。交互作用まで評価できるため、平均値-範囲法より詳細な分析が可能で、MinitabやJMPなどの統計ソフトを使えば自動で算出できます。
| 比較項目 | 平均値-範囲法 | ANOVA法 |
|---|---|---|
| 計算ツール | Excelだけで可能 | 統計ソフト推奨 |
| 交互作用の評価 | ❌ できない | ✅ できる |
| 精度 | 近似計算 | より正確 |
| 使用場面 | 簡易評価・統計ソフトがない環境 | 正式評価・PPAP提出用 |
Excelでの計算手順を簡単に示すと、次のようになります。まず各測定者が10個の部品を3回ずつ測定したデータを用意します。各測定者・各部品の「範囲R(最大値−最小値)」を求め、測定者全体の範囲平均(R̄̄)を算出します。そこから繰返し性(EV)を求め、次に測定者間の平均値の差から再現性(AV)を計算します。これらをもとにGRRとTVを求め、最終的に%GRR = (GRR ÷ TV)× 100 で判定します。
統計ソフトがある環境ならANOVA法を使うことが推奨されます。PPAP(Production Part Approval Process)の提出書類に含める場合は特に、より精度の高いANOVA法での算出が顧客から求められることが多いです。
これは使えそうです。
参考:EV・AV・PVの計算式をExcelで再現する具体的な手順と、판定基準・NDCまでを完全解説
【完全保存版】MSA入門|ゲージR&Rの計算手順をExcelで完全再現(しらすソロ)
%GRRが合格でも見落とされる「サンプル選びの落とし穴」と独自改善策
多くのゲージR&Rガイドでは%GRRの判定基準やEV・AVの改善策が中心に説明されますが、現場で頻発するのに見落とされがちな問題があります。それが「サンプルの選び方」です。
%GRRの計算式は次の通りです。
TVの中にPV(部品間のばらつき)が含まれています。つまり、%GRRの分母はPVの大きさにも左右されるということです。
サンプル10個を「たまたま規格中央付近の部品ばかり」から選ぶと、PVが人工的に小さくなります。PVが小さければTVも小さくなり、結果的に%GRRが実態より大きく算出されます。測定システムに問題がなくても「不合格」と誤判定されるリスクがあります。逆もまた真で、ばらつきの大きいサンプルだけを選べば%GRRが実態より小さく出てしまいます。
意外ですね。
正しいサンプル選定のポイントは次の通りです。
- 📏 公差範囲全体(下限付近・中央・上限付近)をカバーするように選ぶ
- 🔢 少なくとも10個を用意し、大きめ・中くらい・小さめを均等に混ぜる
- 🏭 通常の製造工程で作られた実際の製品から選ぶ(特別に作ったサンプルは不可)
- 🔖 各サンプルに識別番号を付け、測定者が前回値を見て影響されないよう管理する
加えて、測定の順番もランダムにすることが重要です。測定者が「このサンプルはさっき10.02mmだった」と記憶した上で再測定すると、意識的・無意識的に数値が引っ張られます。日をまたいで測定するか、サンプルの提示順をランダムにすることで、記憶バイアスを排除できます。
また、測定間隔にも注意が必要です。同日中に連続して3回測定させると、測定者が直前の値を覚えていて意識的に同じ値を出そうとすることがあります。理想的には、少なくとも数時間の間隔を空けて測定するか、他の作業の合間に実施することで、より現実的なばらつきを捉えられます。
もう一つ独自の視点として紹介したいのが「環境要因の管理」です。金属加工現場では、機械加工熱や工場内の温度変化によって測定対象物そのものの寸法が変動することがあります。アルミや鉄製の部品は線膨張係数(アルミ:約23×10⁻⁶/℃、鉄:約12×10⁻⁶/℃)の影響を受けるため、加工直後に測定すると部品温度が安定していない状態での値になります。これはゲージR&Rの評価対象ではありませんが、測定値のばらつきに見えることがあるため、測定前に部品を室温(20±2℃が標準)で馴染ませる時間を設けることをお勧めします。JIS B 0680では23℃±2℃が基準温度として規定されています。
サンプル選びと温度管理が条件です。
参考:測定システム解析(MSA)の要求事項と、ゲージR&Rのサンプル選定に関する解説
【ゲージR&Rとは?】目的と使い方(アイアール技術者教育研究所)
ゲージR&Rの判定基準と測定システム改善で品質クレームを防ぐ実践ステップ
ゲージR&Rの数値を正しく評価した後は、現場の品質保証活動に実際につなげることが最終目標です。ここでは、金属加工現場で測定システムを改善するための実践的な手順を整理します。
まず、%GRRが30%超の場合の対応フローを確認します。
- 🔍 EV・AV比率の確認:どちらが支配的かを特定する
- 🔧 EV大の場合:測定器の校正・オーバーホール → 分解能の確認(公差の1/10以下か)→ 治具の固定方法の見直し
- 📋 AV大の場合:測定SOP(標準作業手順書)の作成・改訂 → 全測定者への教育・訓練 → 測定ポイントをバルーン図面で明確化
- 🔄 改善後の再実施:同じサンプル・同じ条件でゲージR&Rを再測定し、%GRRとndcを確認
%GRRが10〜30%の「条件付き合格」ゾーンにある場合は、顧客や製品の重要度によって対応を判断します。IATF16949の審査や自動車メーカーへのPPAP提出が必要な場合は、10%未満が求められることが多いです。一方で、社内の工程管理目的で使用する場合は、改善コストと品質リスクのバランスで判断することも現実的です。
定期的な再評価も重要です。測定器の状態は時間とともに変化し、測定者の交替や手順の変更が再現性に影響することがあります。少なくとも年1回、または測定器の修理・交換・工程変更があったタイミングでゲージR&Rを再実施することが推奨されています。
また、AIAGとVDAでは判断基準の考え方が異なることも押さえておく必要があります。AIAGは%GRRで測定システム全体を評価するのに対し、VDAはCg/Cgk(測定器単体の能力指数)で評価します。顧客がドイツ系自動車メーカーの場合はVDA方式を求められることがあるため、取引先の要求事項を事前に確認してから評価方式を決定してください。
結論は顧客要求の確認が最優先です。
ゲージR&Rを継続的に実施することで、測定システムの劣化を早期に検知でき、不良流出によるクレームや手直し費用を未然に防ぐことができます。測定システムの信頼性は、製品品質の信頼性そのものを支える基盤です。
参考:AIAGとVDAのGR&R基準の違いと、現場での実務的な注意点を詳しく解説