ゲージR&R判定基準の正しい読み方と改善手順

ゲージR&Rの判定基準と正しい評価・改善の進め方

ゲージR&Rの判定基準と正しい評価・改善の進め方

校正済みの測定器を使っているのに、サンプルの選び方を間違えると%GRRが実際より30%以上大きく算出され、正常な測定システムを不合格と誤判定することがあります。

この記事でわかること

📐

判定基準の3段階を正確に理解する

%GRRが10%未満・10〜30%・30%超でそれぞれ何を意味し、金属加工現場でどう対処すべきかを数字ベースで解説します。

🔢

EV・AV・PVの計算と読み方

繰り返し性（EV）と再現性（AV）のどちらに問題があるかで打ち手が変わります。計算式と改善の方向性を具体的に説明します。

✅

ndc（知覚区分数）と現場での活用法

%GRRだけでなくndcが5以上あるかも合否の重要指標です。ANOVA法・平均値-範囲法の使い分けも解説します。

ゲージR&Rの判定基準とは何か：%GRRの3段階評価を理解する

金属加工の現場では、測定器を定期的に校正していれば「測定は大丈夫」と思いがちです。しかし、校正はあくまで測定器単体の精度確認にすぎません。実際の測定システムには、測定者のスキル差・測定手順の解釈のズレ・治具の固定条件・室温など、測定値のばらつきに影響を与える要素がいくつも潜んでいます。

ゲージR&R（Gage Repeatability and Reproducibility）は、こうした測定システム全体のばらつきを定量的に評価する手法です。最も重要な指標が%GRRで、全体のばらつき（TV：Total Variation）に占める測定システムのばらつきの割合をパーセントで示します。

%GRRの判定基準は、AIAG（米国自動車産業アクション・グループ）が策定したMSAマニュアル第4版をもとに、製造業界で広く採用されています。

%GRRの範囲	判定	対応
10%未満	✅ 合格（良好）	そのまま使用可能
10〜30%	⚠️ 条件付き合格	用途・重要度に応じて使用可否を判断。改善を検討する。
30%超	❌ 不合格	測定システムの改善が必須。原因を特定し対策を実施する。

この基準はもともと自動車業界向けに策定されたものですが、現在では金属加工・電子部品・精密機械など幅広い製造業で標準的に使われています。IATF16949の認証取得やPPAP（生産部品承認プロセス）の提出書類にも含まれており、取引先から提出を求められるケースも増えています。

%GRRは「小さいほど良い」という性質があります。10%未満なら、測定値のばらつきのうち測定システム側に起因する部分はわずか10分の1以下に収まっており、製品本来のばらつきをほぼ正確に捉えられていると言えます。つまり10%以下が基本です。

30%以上になると、観測しているばらつきの3割以上が測定システム由来であることを意味します。これは「測定しているのに、製品の真の品質が見えていない」状態であり、不良品の見落としや良品の廃棄につながる深刻なリスクがあります。

参考リンク（%GRRの判定基準と計算方法の詳細）。

GR&Rの計算方法をANOVA法でわかりやすく解説（SiGmA Eye）

ゲージR&Rの計算式：EV・AV・PV・GRR・TVの求め方

%GRRを正しく算出するためには、まずEV・AV・PV・GRR・TVという5つの指標の意味と計算の流れを把握する必要があります。これらは互いに連動しており、どれか一つを誤ると最終的な判定結果が大きくずれてしまいます。

📌 EV（繰り返し性：Equipment Variation）：同一の測定者が同じ部品を同じ測定器で繰り返し測定したときのばらつき。測定器自体の精度や治具の安定性が反映されます。
📌 AV（再現性：Appraiser Variation）：異なる測定者が同じ部品を測定したときのばらつき。測定手順の標準化度合いや測定者のスキル差が数字に出ます。
📌 PV（部品変動：Part Variation）：サンプル間の実際の寸法差。製品本来のばらつきであり、測定システムの問題ではありません。むしろPVが大きいほど測定システムの識別力が発揮されます。
📌 GRR（測定システムのばらつき）：EV²＋AV²の平方根で求めます。
📌 TV（全体のばらつき）：GRR²＋PV²の平方根で求めます。

計算式をまとめると次のようになります。

$$GRR = \sqrt{EV^2 + AV^2}$$

$$TV = \sqrt{GRR^2 + PV^2}$$

$$\%GRR = \frac{GRR}{TV} \times 100$$

金属部品の外径測定を例に取ると、マイクロメータを使って公差±0.10mmの部品を3名の作業者が10個×3回ずつ測定し、EVが0.014mm、AVが0.003mmだった場合、GRRは約0.014mmとなります。TVが0.040mmであれば、%GRRは約35%となり不合格です。

この例では公差幅0.20mmに対して測定ばらつき（GRR）が0.014mmと一見小さく見えるかもしれませんが、サンプル間のばらつき（PV）が小さいと%GRRは大きく出てしまいます。それがサンプル選びの重要性につながってきます。

計算方法には「平均値-範囲法（X̄-R法）」と「ANOVA法（分散分析法）」の2種類があります。ExcelだけでできるのはX̄-R法ですが、測定者と部品の「交互作用」（特定の測定者が特定の部品を測ると結果がずれる現象）を検出できるのはANOVA法だけです。MinitabなどのMSA対応ツールがある環境ではANOVA法を選ぶのが原則です。

参考リンク（EV・AV・PVの具体的な計算と評価方法）。

ゲージR＆Rの目的と使い方・計算式まとめ（アイアール技術者教育研究所）

ゲージR&Rのサンプル選びが%GRRを左右する：金属加工現場の落とし穴

多くの金属加工現場で見落とされがちなのが「サンプルの選び方」です。%GRRの計算式を見ると、分母にはTV（全体のばらつき）が入っています。TVはGRRとPVの合成値なので、PV（サンプル間の部品ばらつき）が小さいとTVも小さくなり、同じGRRでも%GRRが不当に大きく算出されてしまいます。

たとえば、規格中央付近の寸法がほぼ同じ10個の部品だけを使ってゲージR&Rを実施した場合、PVが極端に小さくなります。この状態では、測定器に何も問題がなくても%GRRが30%を超えることがあります。結果、現場では「測定器を変えなければ」という誤った判断につながります。これは時間とコストの無駄です。

正しいサンプルの選び方は次の通りです。

🔵 公差範囲全体をカバーするように、小さめ・中くらい・大きめの部品を意図的に混ぜる
🔵 10個以上を用意し、実際の製造工程から無作為に選ぶ（特別に作ったサンプルは不可）
🔵 各サンプルに識別番号を振り、測定者がどの部品を測定しているか分からないよう配慮する（バイアス排除）

また、測定間隔にも注意が必要です。同じ測定者が短時間に連続して同じ部品を測ると、前回の測定値を覚えている影響が生じ、EVが不当に小さく算出されます。少なくとも数時間、できれば1日以上の間隔を空けることが推奨されています。

測定環境の統一も見落とせません。金属部品は温度変化で寸法が変わります（熱膨張）。室温が違う時間帯や季節をまたいで測定すると、温度由来のばらつきが混入します。JIS規格で推奨されている20℃±2℃の環境での測定が理想です。精密加工部品であれば、恒温室や空調管理された測定室での実施を検討してください。

これは使えそうです。サンプル選びを見直すだけで、%GRRの数値が大幅に改善したケースは現場でも珍しくありません。

参考リンク（サンプル選定の注意点と%GRRへの影響）。

ゲージR&Rの典型的な誤りと回避策（TMCシステム）

EV（繰り返し性）とAV（再現性）の分析で改善アクションを決める

%GRRが不合格だった場合、次にすべきことはEVとAVのどちらが大きいかを確認することです。この2つの原因はまったく別物であり、打ち手も変わります。闇雲に測定器を交換しても、問題がAV（測定者側）にある場合は改善しません。原因を取り違えると、時間とコストが無駄になります。

EVが大きい（繰り返し性が悪い）場合は、同じ人が同じ部品を測ってもばらつきが出ている状態です。測定器・治具・環境に問題があることが多いです。

⚙️ 測定器の分解能が不足している：公差の10分の1以下の分解能が必要です。たとえば公差±0.10mm（公差幅0.20mm）なら、分解能0.01mm以下のマイクロメータが必要です。
⚙️ 測定器の摩耗・劣化：定期校正のほかにオーバーホールを検討します。
⚙️ 治具のガタつき：部品の固定が安定していないと毎回測定位置がずれます。位置決めピンや固定治具の改善が有効です。
⚙️ 温度・振動などの環境要因：防振台や恒温環境の整備が必要です。

AVが大きい（再現性が悪い）場合は、人が変わると測定値が変わっている状態です。測定者・手順・教育に課題があります。

👷 測定SOP（標準作業手順書）が未整備：「どこを・どうやって・何mm読み取るか」を文書化し、全測定者に教育します。
👷 測定ポイントが図面上で曖昧：バルーン図面や測定箇所のマーキングで、測定位置のばらつきをなくします。
👷 測定者の技量差：熟練者とOJTで測定練習を積みます。特に金属部品はノギスやマイクロメータの当て方・締め付けトルクに個人差が出やすいです。

自動車部品メーカーの改善事例では、再現性（AV）に問題が集中していた測定工程で測定手順書を整備し、全作業者に半日の再教育を実施した結果、%GRRが40%超から18%に改善されたケースがあります。クレーム件数が従来の3分の1に減少したという報告もあります。

また、EVとAVを比較するとき、どちらが「主犯」かを把握するには各指標の%TVも確認してください。たとえば%EV（繰り返し性の割合）が高く%AV（再現性の割合）が低ければ、測定器や治具の改善が優先事項です。結論は「EVとAVの比率で打ち手が変わる」ということです。

ndc（知覚区分数）の判定基準と%GRRとの関係：独自視点の解説

%GRRと並んで見落とされがちな重要指標がndc（Number of Distinct Categories：知覚区分数）です。ゲージR&Rの現場ではあまり注目されませんが、ndcは%GRRが同じでもサンプルの状態によって意味が変わるという独自の特性を持っています。

ndcの計算式は次の通りです。

$$ndc = 1.41 \times \frac{PV}{GRR}$$

判定基準は「ndc ≧ 5」が合格です。ndcが5以上であれば、測定システムが製品のばらつきを5段階以上に区別して識別できるということを意味しています。イメージとしては、10段階評価で「1〜2点」「3〜4点」「5〜6点」「7〜8点」「9〜10点」の5つに分けて識別できるようなものです。

ndcが5未満の場合、測定システムの「分解能」が低すぎて、製品の良否を細かく判定できない状態です。工程管理やSPC（統計的工程管理）を行おうとしても、測定値の区別が粗すぎて有効な管理ができません。

実は%GRRとndcは数学的に連動しています。%GRRが小さいほどndcは大きくなり、%GRRが10%未満であれば通常ndcは5以上になります。逆にndcが5未満のとき、%GRRが正常に見えていても、サンプルのPVが極端に小さいためにndcだけが低い状態が起きることがあります。これが現場でよく混乱を生む落とし穴です。

具体的な例で考えてみましょう。EVが0.014mm、AVが0.003mmでGRRが0.014mm、サンプルのPVが0.02mmの場合、%GRRはTV（0.024mm）に対して約58%と高くなります。しかしもしPVを正しく選定して0.038mmにできていれば、TV=0.041mm、%GRRは約34%に下がります。ndcも 1.41×(0.038/0.014)＝3.83 から 1.41×(0.038/0.014)＝3.83 で変化します。ただし30%を超えているため、依然として改善は必要です。

ndcと%GRRの両方を確認する習慣を持つことで、「測定器の問題なのか・サンプル選びの問題なのか」をより正確に切り分けることができます。顧客や審査員からndcの提出を求められた場合も、両方の数値と判定基準をセットで報告書に記載できるとよいでしょう。

参考リンク（ndcの意味と%GRRとの関係）。

ゲージR&Rの「ndc（知覚区分数）」の意味（日本科学技術連盟）

参考リンク（AIAG MSAマニュアル準拠の計算手順とExcel再現）。

MSA入門：ゲージR&Rの計算手順をExcelで完全再現（shirasusolo.net）