中小製造業DX支援の専門家「データと仕組みで、現場の力を引き出す」田邉 正明です。
「AI外観検査を試してみたけれど、結局は現場で使えなかった」
中小製造業のDX相談で、よく出てくるテーマのひとつです。
展示会やベンダー資料を見ると、AI外観検査はすぐに使えそうに見えます。カメラで画像を撮り、不良品を学習させれば、人の目の代わりにAIが判定してくれる。そう考えると、検査員不足や検査バラツキに悩む工場にとって、とても魅力的な解決策に見えます。
しかし実際には、PoCでよい結果が出ても、量産ラインに入れる段階で止まってしまうことがあります。PoCとは、実際に使えるかどうかを小さく試す検証のことです。AI外観検査では、対象工程によっては数百枚から数千枚の画像を使い、良品と不良品をどこまで判定できるかを確かめます。
では、なぜ止まるのでしょうか。
答えは、AIモデルの精度だけの話ではありません。むしろ、モデルを選ぶ前に決めるべきことが決まっていないために、現場導入でつまずくことが少なくありません。
AI外観検査を現場で使い続けるには、次の4つを先に整える必要があります。
- 何を不良と呼ぶのか
- どの条件で画像を撮るのか
- どのデータで評価するのか
- 判定結果を現場でどう扱うのか
この記事では、中小製造業がAI外観検査をPoCで終わらせないために、最初に決めるべきことを整理します。難しいAIアルゴリズムの解説ではなく、品質保証、製造、設備、生産技術、経営が同じテーブルで判断するための実装論としてまとめます。
AI外観検査とは何か
AI外観検査とは、製品や部品の画像を使って、キズ、打痕、汚れ、欠け、変色、異物付着などを自動で判定する仕組みです。
従来の画像検査では、あらかじめ決めたルールに沿って判定します。たとえば「黒い点がこの面積以上なら不良」「この輪郭から外れたら不良」「この寸法範囲を超えたら不良」といった形です。これをここでは、ルールベース画像処理と呼びます。
一方、AIを使った外観検査では、画像の特徴から良品と不良品の違いを学習します。特に、人が言葉で説明しにくいムラ、微妙な質感の違い、表面のゆらぎ、複雑な形状変化などに使われることが多いです。
ただし、AIが従来の画像処理をすべて置き換えるわけではありません。寸法、位置、面積、輪郭のように基準がはっきりしているものは、従来の画像処理の方が速く、安定して、説明もしやすい場合があります。
中小製造業で考えたいのは、AIだけで全部やることではありません。ルールで判定できるものはルールで処理し、人が見ても判断に迷いやすい部分をAIに任せることです。この役割分担を決めるだけでも、導入費用と運用負荷は大きく変わります。
なぜAI外観検査はPoCで止まりやすいのか
AI外観検査がPoCで止まる理由は、現場でよく似ています。
ひとつ目は、欠陥の定義があいまいなことです。ベテラン検査員なら「これは許容」「これは出荷できない」と判断できても、その理由が図面や検査基準書に十分に書かれていないことがあります。人の中では判断できていても、データにすると基準が揺れるのです。
ふたつ目は、撮像条件が安定していないことです。同じ製品でも、照明、角度、位置、背景、カメラの焦点、搬送時のブレで見え方は変わります。人は多少の見え方の違いを補正して判断できますが、AIは撮り方の変化をそのまま別の特徴として受け取ります。
三つ目は、評価データが都合よく作られてしまうことです。PoCでは、きれいに撮れた画像や、分かりやすい不良品だけで評価されることがあります。しかし量産ラインでは、汚れた治具、照明の劣化、原材料ロットの違い、作業者の置き方の違いが起きます。そこまで含めて評価しないと、本番で使えるかどうかは分かりません。
四つ目は、AIの判定後の業務フローが決まっていないことです。AIが不良と判定したものを止めるのか、自動で排出するのか、人が再確認するのか。これが決まっていないと、現場はAIの判定に振り回されます。
つまり、AI外観検査の成否は「AIが良品と不良品当を判定できるかどうか」だけで決まりません。現場で使うための基準、撮像、評価、運用がそろって、はじめて導入判断ができます。
最初にやるべきことは「不良の名前」をそろえること
AI外観検査で最初にやるべきことは、カメラ選定でもモデル選定でもありません。
最初にやるべきことは、不良の名前をそろえることです。
たとえば、同じ表面欠陥でも、現場では「キズ」「スジ」「打痕」「ムラ」「汚れ」「異物」「欠け」など、いろいろな言葉が使われます。しかし人によって、同じものを「キズ」と呼んだり「打痕」と呼んだりすることがあります。これをそのままAI学習に使うと、教師データの中に矛盾が入ります。
教師データとは、AIに学習させるために正解ラベルを付けたデータのことです。外観検査では、画像に対して「良品」「不良品」「キズ」「汚れ」などのラベルを付けます。このラベルが揺れると、AIは何を学べばよいのか分からなくなります。
まずは、欠陥を次のように整理します。
| 分類 | 内容 | 決めること |
|---|---|---|
| 明確な良品 | 誰が見ても出荷できるもの | 良品画像の基準にする |
| 明確な不良品 | 誰が見ても出荷できないもの | 検出対象にする |
| グレーゾーン | 人によって判断が分かれるもの | 出荷基準と再判定ルールを決める |
特に重要なのは、グレーゾーンです。
AI外観検査では、グレーゾーンをどう扱うかで結果が大きく変わります。グレーゾーンをすべて不良側に倒せば、見逃しは減りやすくなります。しかし良品まで不良扱いする過検出が増え、再検査や廃棄が増える可能性があります。逆に良品側に倒せば、現場の負荷は軽くなりますが、顧客クレームにつながる見逃しが増えるかもしれません。
ここはAI担当者だけで決める話ではなく、品質保証、製造、営業、経営が一緒に決めるべき内容です。なぜなら、どこまでを不良とするかは、品質リスク、顧客要求、原価、納期に関わるからです。
検査員の判断がそろっているかを先に測る
AIに学習させる前に、人の判断がどれくらいそろっているかを確認する必要があります。
方法は難しくありません。たとえば同じ画像を100枚程度用意し、複数の検査員に独立して判定してもらいます。相談せずに、それぞれが良品、不良品、グレーゾーンを付けます。そのうえで、どれくらい判断が一致しているかを確認します。
ここで一致率が低い場合、AI化の前にやるべきことがあります。それは、検査基準の見直しです。
人の判断がそろっていない状態でAIを入れると、AIは矛盾した正解を学習します。ある検査員が良品とした画像を、別の検査員が不良品としてラベル付けしていると、AIは同じ特徴に対して違う答えを学ぶことになります。
この状態では、いくら高性能なAIを使っても判定精度に限界があります。AIの性能問題に見えて、実は検査基準の問題だったというケースは少なくありません。
AI外観検査は、ベテラン検査員の判断を言語化し、若手に伝え、組織の基準に変えるきっかけになります。検査基準の標準化に取り組むことで、AIを入れなくても品質管理のレベルは上がります。
不良品が少ない場合は、良品から外れたものを見る
製造業では、不良品のデータが少ないことがよくあります。
これは悪いことではありません。工程が安定していれば、不良品はあまり出ないからです。しかしAIを学習させる立場から見ると、不良品が少ないことは大きな課題になります。
良品と不良品を大量に集めて分類する方法は、分かりやすい一方で、不良品の種類が少ないと学習が偏ります。過去に出た不良は見つけられても、未知の不良を見逃す可能性があります。
そこで中小製造業で検討しやすいのが、良品を中心に学習する考え方です。これは、良品の画像をたくさん集め、そこから外れたものを異常として検出する方法です。
たとえば、次のような考え方があります。
| 方法 | 考え方 | 向いている場面 |
|---|---|---|
| 良品との差分を見る方法 | 良品らしい画像と比べて、再現しにくい部分を異常と見る | 不良品が少なく、良品画像が多い工程 |
| 特徴の距離を見る方法 | 良品の特徴から離れた画像を異常と見る | 表面模様や質感の違いを見たい工程 |
| ルールとAIを組み合わせる方法 | 位置や寸法はルールで見て、質感やムラはAIで見る | 欠陥の種類が複数ある工程 |
ここで大事なのは、画像認識の手法の名前を覚えることではありません。自社の工程で「良品は安定しているか」「不良品は十分に集められるか」「未知の不良を見たいのか」を決めることです。
不良品が少ない工程では、最初から不良分類だけを狙うより、良品から外れたものを拾う設計の方が現実的な場合があります。ただし、この方法では「いつもと違うもの」を拾うため、すべてが本当の不良とは限りません。だからこそ、人の再判定フローとの組み合わせで設計する必要があります。
撮像条件で精度の上限が変わる
AI外観検査で軽視されやすく、結果に大きく効くのが撮像です。
撮像とは、検査対象をカメラで撮る条件全体のことです。カメラだけでなく、照明、レンズ、背景、位置決め、搬送、焦点、露光時間まで含みます。
現場で「AIの精度が出ない」と言われる場合、モデルよりも撮像に原因があることがあります。人間の目には見えている欠陥でも、画像に写っていなければAIは判断できません。逆に、画像にノイズや反射が多ければ、AIは欠陥ではないものを欠陥と見なしてしまいます。
照明は、欠陥の種類によって変える必要があります。
| 欠陥・対象 | 見たいもの | 撮像の考え方 |
|---|---|---|
| 光沢面のキズ | 細い線状の変化 | 反射を利用する照明条件を試す |
| 打痕・凹凸 | 表面の高さ変化 | 斜めから光を当てる |
| 汚れ・変色 | 色や濃淡の違い | 拡散光でムラなく照らす |
| 透明・半透明部品 | 内部の濁りや異物 | 透過光や偏光を検討する |
| 微細部品 | 小さな欠けや付着物 | レンズ倍率とピント範囲を調整する |
撮像で特に注意したいのは、PoC用の撮り方と量産ラインの撮り方を変えないことです。
机の上で手作業で置いて撮った画像ではうまくいったが、実際のラインでは位置ズレや振動で精度が落ちる。これはよくある失敗です。PoCの段階から、できるだけ本番に近い治具、照明、搬送条件で撮る必要があります。
AI外観検査では、モデルの検討より先に「どう撮れば欠陥が安定して写るか」を決めるべきです。ここを飛ばすと、あとからモデルを変えても改善しにくくなります。
評価指標はAccuracy(正確さ)だけで見てはいけない
AI外観検査の評価で、Accuracy (正確さ)という言葉がよく出てきます。Accuracyとは、全体のうち何%を正しく判定できたかを示す指標です。
しかし、製造業の外観検査では、Accuracyだけで判断すると危険です。
たとえば、不良率が1%の工程を考えます。この工程で、AIがすべてを良品と判定したとします。不良はすべて見逃しますが、全体の99%は良品なので、Accuracyは99%になります。数字だけ見ると高精度に見えますが、品質保証としては使えません。
中小製造業で見るべき指標は、次の5つです。
| 指標 | 意味 | 現場への影響 |
|---|---|---|
| 見逃し率 | 不良を良品と判定した割合 | 顧客クレームに直結する |
| 過検出率 | 良品を不良と判定した割合 | 再検査工数と廃棄が増える |
| 再判定率 | 人が確認する必要がある割合 | 検査員の負荷に直結する |
| 判定時間 | 1個あたりの判定にかかる時間 | タクトタイムに影響する |
| 歩留まり影響 | 過検出で良品を止める影響 | 原価に影響する |
この中で最も重要なのは、見逃し率です。不良を良品として流してしまえば、顧客クレームや選別対応につながります。
ただし、見逃し率だけを下げればよいわけでもありません。見逃しを怖がって、少しでも怪しいものをすべて不良にすると、過検出が増えます。その結果、良品を大量に再検査することになり、現場の負荷は増えます。
つまり、AI外観検査は「見逃しを減らすこと」と「過検出を増やしすぎないこと」のバランスを取る仕事です。このバランスは、工程ごとの品質リスクと再検査工数によって変わります。
PoCの合格条件は始める前に決める
PoCを始める前に、合格条件を決めておく必要があります。
これを後から決めると、「思ったよりよかった」「もう少し改善すれば使えそう」というあいまいな評価になります。結果として、PoCだけが続き、本番導入の判断ができなくなります。
少なくとも、次の項目は事前に決めておきます。
| 項目 | 決める内容 |
|---|---|
| 対象工程 | どの製品、どの工程、どの欠陥を見るか |
| 評価データ | 何枚の画像で評価するか |
| データの内訳 | 良品、不良品、グレーゾーンをどう含めるか |
| 見逃し率 | どこまで許容できるか |
| 過検出率 | どこまでなら現場が再検査できるか |
| 判定時間 | タクトタイム内に入るか |
| 再判定ルール | AIが迷ったものを誰が見るか |
| 導入判断 | どの条件を満たせば本番に進むか |
ここで大事なのは、ベンダーに評価を丸投げしないことです。
ベンダーは技術の専門家ですが、自社の品質基準、顧客要求、再検査工数、現場の作業負荷までは分かりません。評価データの選定、合格ライン、現場での判定ルールは、自社が主導する必要があります。
AI外観検査は、AIを買うプロジェクトではなく、検査の判断基準を会社として決め直すプロジェクトということです。
本番運用では「AIが迷ったもの」をどう扱うかが重要になる
本番運用で重要なのは、AIが良品か不良品かを完全に決め切ることではありません。
現実的には、次の3つに分ける方が運用しやすくなります。
明確に良品は自動で通します。明確に不良品は排出し、画像と判定結果を記録します。迷うものは、人の再判定に回します。
- 明確に良品
- 明確に不良品
- 迷うもの(グレーゾーン)
この「迷うもの」を設計することが大切です。
AIの判定スコアが中間にあるもの、画像がブレているもの、照明が外れているもの、過去に少ないパターンのものは、無理にAIだけで決めない方が安全です。AIを人の代わりにするのではなく、人が見るべきものを絞る仕組みとして使う方が、導入しやすい現場も多いです。
たとえば、これまで検査員が1,000個すべてを見ていた工程で、AIが明確な良品700個を通し、明確な不良20個を排出し、残り280個を人が見る。この形でも、人の負荷は大きく下がります。
最初から完全自動化を狙う必要はありません。まず人の見る量を減らし、判定のバラツキを小さくし、検査記録を残すところから始める方が現実的です。
導入後はモデルよりもデータの変化を見る
そして、AI外観検査は一度導入したら終わりではありません。
製造現場では、時間とともに条件が変わります。材料ロットが変わる、季節で湿度が変わる、照明が劣化する、カメラがずれる、治具が摩耗する、作業者の置き方が変わる。作業者が交代する。こうした変化によって、画像の見え方は少しずつ変わります。
その結果、導入当初はうまく判定できていたAIが、数か月後に過検出を増やしたり、見逃しを起こしたりすることがあります。
そのため、次の項目を定期的に見ます。
| 監視項目 | 見る理由 |
|---|---|
| 判定スコアの分布 | いつもと違う画像が増えていないかを見る |
| 過検出率 | 良品を止めすぎていないかを見る |
| 見逃し率 | 不良を流していないかを見る |
| 再判定件数 | 人の負荷が増えていないかを見る |
| 撮像画像の明るさ | 照明やカメラの変化を見る |
| 欠陥の種類 | 新しい不良が出ていないかを見る |
特に大事なのは、判定結果と画像を残すことです。
AIが不良と判定した画像、人が再判定した画像、顧客クレームにつながった画像を残しておけば、次の改善に使えます。逆に、判定だけして画像を残さない運用にすると、後から原因を追えません。
AI外観検査は、一度作ったモデルを固定して使い続けるものではなく、現場の変化に合わせて、基準とデータを見直し続ける仕組みとして運用することが大切です。
ベンダーに任せるところと自社で握るところ
中小製造業がAI外観検査を導入するとき、すべてを自社で作る必要はありません。カメラ、照明、画像処理、AIモデル、装置連携は、専門ベンダーの力を借りる方が早いです。
ただし、すべてを任せてはいけません。
ベンダーに任せてよいものと、自社で握るべきものを分ける必要があります。
| 領域 | 主導すべき人 |
|---|---|
| カメラ・照明・レンズの選定 | ベンダーと生産技術 |
| AIモデルの構築 | ベンダーまたは技術部門 |
| 欠陥定義 | 品質保証と製造 |
| グレーゾーン判断 | 品質保証、製造、営業、経営 |
| 評価データの選定 | 自社 |
| PoC合格条件 | 自社 |
| 再判定フロー | 製造と品質保証 |
| モデル更新ルール | 自社とベンダーの共同 |
技術は買えます。しかし、自社の品質基準は買えません。
ここを間違えると、PoCではよい結果が出ても、本番で「この判定は現場の感覚と違う」「この不良は顧客によって許容が違う」「再検査が増えて現場が回らない」といった問題が出ます。
AI外観検査の主導権は、ベンダーではなく自社が持つべきです。特に、欠陥定義、評価指標、再判定フロー、モデル更新ルールは、自社の品質保証と製造が中心になって決める必要があります。
業種別に見るAI外観検査の注意点
AI外観検査は、業種によって難しさが変わります。AIモデルの違いよりも、撮像と欠陥定義の違いが大きいからです。
| 業種・工程 | 起きやすい課題 | 最初に確認すること |
|---|---|---|
| 金属加工 | 反射、加工目、細かなキズの区別 | 光の当て方で欠陥が安定して見えるか |
| 鋳造・鋳物 | 表面凹凸が大きく、正常と異常の境界が難しい | 欠陥の種類を分けて定義できるか |
| 樹脂成形 | ヒケ、黒点、バリ、透明部品の見えにくさ | 照明と背景で差が出るか |
| 電子部品 | 微細欠陥、位置ズレ、ピント範囲 | 必要な解像度と撮像範囲を両立できるか |
| 表面処理 | ムラ、変色、ピンホール、光沢差 | 良品のばらつきをどこまで許容するか |
| 食品・包装 | 形状のばらつき、汚れ、異物、衛生制約 | 環境変動に耐えられる撮像ができるか |
同業他社の事例だけを探すと、参考情報が少ない場合があります。そのときは、同じ撮像課題を持つ他業種を見るとヒントが見つかります。
たとえば、金属の反射に悩むなら、鏡面部品やフィルム検査の考え方が参考になるかもしれません。透明品の検査なら、樹脂、ガラス、食品包装の撮像技術が参考になります。
AI外観検査では、業界名よりも「何が見えにくいのか」で考える方が、解決策に近づきます。
中小製造業が最初の3か月でやること
AI外観検査をいきなり全社展開する必要はありません。
最初の3か月は、次のように進めるのが現実的です。
1か月目:対象工程と欠陥定義を決める
最初の1か月は、対象工程を絞ります。人手が足りない工程、検査バラツキが大きい工程、顧客クレームにつながりやすい工程から候補を出します。
そのうえで、良品、不良品、グレーゾーンの画像を集めます。検査員に同じ画像を判定してもらい、判断がそろっているかを確認します。ここで基準がそろわない場合は、AIの前に検査基準書を見直します。
2か月目:撮像条件を固める
次に、撮像条件を決めます。照明、レンズ、カメラ位置、背景、治具、搬送条件を変えながら、欠陥が最も安定して見える条件を探します。
この段階では、AIモデルの精度よりも「同じものが同じように写るか」を重視します。撮像が安定すれば、後の学習と評価が進めやすくなります。
3か月目:評価と運用フローを決める
3か月目は、PoC評価を行います。見逃し率、過検出率、再判定率、判定時間を見ます。Accuracyだけで判断せず、現場の再検査工数と品質リスクを合わせて確認します。
同時に、AIが不良と判定したものをどう扱うか、迷ったものを誰が見るか、判定画像をどこに保存するかを決めます。
この3か月で本番導入できなくても問題ありません。大事なのは、本番導入に進めるかどうかを判断できる状態にすることです。
AI外観検査は「検査を自動化するだけ」の話ではない
AI外観検査というと、人の目をAIに置き換える話に見えます。
しかし、中小製造業にとって本当に大きい価値は、検査基準を組織でそろえることにあります。
これまでベテランの中にあった判断を、画像、基準、ラベル、再判定ルールとして残す。検査員ごとの判断差を見える化する。顧客クレームにつながった画像を残し、次の判断基準に反映する。これらは、AIを入れるかどうかに関係なく、品質管理を強くする取り組みです。
AI外観検査で成果が出る会社は、AIモデルだけを見ていません。欠陥定義、撮像条件、評価データ、運用ルールを先に整えています。
逆に、ここを飛ばすと、AIは現場に入りません。PoCでは動いても、量産ラインでは使い続けられません。
AI外観検査は、モデル精度の向上を目指すのが目的のプロジェクトではなく、自社の判定基準を組織で使える形に変えるプロジェクトです。
中小製造業が取り組むべき最初の一歩は、まず、現場の検査員、品質保証、製造、設備担当、経営者が同じ画像を見ながら、「これはなぜ良品なのか」「これはなぜ不良なのか」を言葉にすることです。
その積み重ねが、AI外観検査をPoCで終わらせない一番の近道になります。
出典・参考リンク
経済産業省|“2025年版ものづくり白書”|https://www.meti.go.jp/report/whitepaper/mono/2025/index.html
経済産業省|“「令和6年度ものづくり基盤技術の振興施策」(2025年版ものづくり白書)を取りまとめました”|https://www.meti.go.jp/press/2025/05/20250530001/20250530001.html
J-STAGE|“画像を用いた自動外観検査技術”|https://www.jstage.jst.go.jp/article/isj/55/3/55_348/_article/-char/ja/
J-STAGE|“機械学習を用いたピストンリングの外観検査システム”|https://www.jstage.jst.go.jp/article/ieejias/143/2/143_101/_article/-char/ja/
J-STAGE|“自己教師あり学習を用いた外観検査のための異常検知手法”|https://www.jstage.jst.go.jp/article/pjsai/JSAI2025/0/JSAI2025_3Win577/_article/-char/ja/
MVTec Software GmbH|“The MVTec Anomaly Detection Dataset”|https://www.mvtec.com/research-teaching/datasets/mvtec-ad
International Journal of Computer Vision|“The MVTec Anomaly Detection Dataset: A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection”|https://link.springer.com/article/10.1007/s11263-020-01400-4
Artificial Intelligence Review|“A survey of deep learning for industrial visual anomaly detection”|https://link.springer.com/article/10.1007/s10462-025-11287-7


