製造業でChatGPTがうまくいかない理由｜現場担当者が試してわかった5つの失敗と対処法

「ChatGPTで日報の下書きを作らせたら、書いていない数字が出てきた」

これ、私の実体験です。製造業の生産管理を7年担当してから社内SEになった私が、最初にChatGPTを業務で試したときの話です。

「月報の文章部分を書いて」と頼んだら、実際には測定していないはずの「前月比4.7%改善」という数字が堂々と出てきました。愧てて確認すると、もちろんそんな数字はどこにもありません。

最初はすごく焦りました。「私の使い方が悪かったのか」「ChatGPTは製造業には合わないのか」……。

でも、試行錯誤を続けてわかったのは、失敗には5つの決まったパターンがあるということです。そしてそのほとんどは、「使い方と期待値の問題」で、ChatGPT自体が使えないわけではありませんでした。

この記事では、私が製造業の現場でChatGPTを試して詰まった5つの失敗パターンと、それぞれの原因・立て直し策を正直に書きます。「自分だけじゃなかった」と安堵してもらえるだけでも、読んだ価値はあると思っています。

製造業でChatGPTがうまくいかないのは「使い方の問題」だけではない

失敗の種類は5つに分かれる

ChatGPTの「失敗」は、ひとことで「使い方が悪かった」と片付けられないことが多いです。原因を整理すると、以下の5パターンに分かれます。

プロンプト設計の問題（製造業の文脈が伝わっていない）
ChatGPTが苦手な業務への誤用（画像判定・精密計算への過信）
データ品質の問題（「ゴミを入れればゴミが出る」）
社内展開の壁（「使ってみて」だけでは誰も動かない）
過剰期待による幻滅（「全自動化でやってくれる」と思っていた）

なぜ製造業はChatGPTの難易度が高いのか

製造業の業務は、AI（特に生成AI）にとってやや難易度が高い側面があります。理由は3つです。

専門用語と現場固有のルール: Cpk・UCL・LCL・不良率・ロット番号など、製造業特有の用語と文脈が多い。ChatGPTはこれを「正確に知っている」わけではない
精度を求められる場面が多い: 品質管理・検査・月報など「数字の根拠が問われる」業務にChatGPTを使うと、精度不足が顔在化しやすい
社内ルール・帳票フォーマットが厳格: 「このフォーマットで出して」に対して、AIは自分で適切と判断したフォーマットで出してくることがある

「難しいから使えない」ということではなく、「何に使うかを選ぶ」ことが製造業では特に重要なのです。

失敗パターン①：プロンプト設計の問題（最も多い）

月報の文章を頼んだら榧空の数字が出てきた

最初に話した体験がまさにこれです。「今月の品質月報の文章部分を書いて」と伝えだけで、数字・文脈・業種の背景を渡していませんでした。ChatGPTは「品質月報らしい文章」を生成しようとした結果、それらしい数字を自動的に「補完」してしまったのです。

原因：製造業の業務文脈をAIが知らない

ChatGPTは「言語モデル」であり、あなたの工場のデータ・設備・品番・規格値を知りません。伝えなければ、それらしい内容を自動補完します。「品質月報を作って」は、「この月のCpkデータ・不良件数・前月比をここに貼り付けて、品質月報の文章部分を書いて」と変えなければいけなかったのです。

立て直し策：現場の前提条件をプロンプトに書き込む

失敗を経て、私がたどり着いたプロンプトの書き方は「5W1Hの前提条件を冒頭に書く」です。

【背景】：品質管理担当。部品メーカー、月次の品質会議に提出するレポートを作っている
【目的】：品質月報の文章部分を作りたい
【データ】：（ここに今月のCpk一覧と不良件数を箇条書きで貼り付け）
【条件】：数字は上記データのものだけ使う。データにない数字は絶対に作らない
【出力形式】：500字程度の文章。品質課題と改善方向を含む

この書き方にしたところ、活空の数字が出てくることはほぼなくなりました。

製造業で使えるプロンプトの書き方をもっと知りたい方は、こちらの記事に業務別30本をまとめています。

→ コピペOK！製造業で使えるプロンプト集30選｜生産管理7年が業務別に厳選

失敗パターン②：ChatGPTが苦手な業務への誤用

ChatGPT Visionで外観検査を試みた

「画像を見て判定できるなら、外観検査にも使えるのでは？」と思って試してみました。不良品と良品の画像をChatGPT Visionに送り、「これは不良品ですか？」と聴く実験です。結果は惨敗でした。同じ画像を3回送ると判定が「問題なし」「要確認」「おそらく不良」と毎回変わる。実用になる安定した精度はありませんでした。

なぜなぜ分析で的外れな回答が続いた

「この設備で発生した寸法不良について、なぜなぜ分析を5段階でやって」とChatGPTに頼んだことがあります。出てきたのは「作業者のミス」「工具の磨耗」「管理が不十分」という、あまりにも一般的な内容でした。私の設備は特殊な素材を扱う機械で、その特性を知らないChatGPTには、的確な「なぜ」を導くことができなかったのです。

原因：生成AIと精密判定AIの違いを混同している

生成AIであるChatGPTは、「言語的に自然な文章を生成する」ことに特化しています。

ChatGPTの得意領域	ChatGPTの苦手領域
文書作成・整理・下書き	精密な画像判定
説明文・手順書の初稿	設備固有の知識を要する推論
アイデア出し・構造化	根拠っき数値計算
言語系の整理・要約	社内規格値との照合

立て直し策：「言語系業務」に用途を絞る

外観検査の自動化はChatGPTではなく、専用の画像認識システム（学習コストと精度保証が必要）の話です。

一方でなぜなぜ分析は、現場の状況を詳しく書いたプロンプトに変えたら改善しました。設備の構造・素材特性・変動のタイミングまで書くと、現場を知った上での分析が出てくるようになりました。

失敗パターン③：データ品質の問題

「汚いExcelデータをCode Interpreterに渡した結果」、出力されたグラフは見た目は綺麗でしたが、実際の傾向と全然合わない。後で見ると、元データに欠損値・入力ミス・日付フォーマットの揺れがあちこちに散らばっていました。

「ゴミを入れればゴミが出る」——これは機械学習の世界でよく言われますが、ChatGPTでも同じです。AIは入力データの品質に完全に依存します。AIを使う前に、手元のデータがどれだけ整っているかを確認することが先決です。

失敗パターン④：社内展開で誰も使わなくなった

自分でChatGPTを使いこなせるようになってから、「みんなにも使ってほしい」と思い、部門に展開しようとしました。ChatGPTのアカウントの作り方と基本的な使い方を説明して、「便利なので活用してみてください」と伝えたのですが……。3週間後にはほぼ誰も使っていませんでした。

「便利そう」だけでは人は動きません。「今の仕事のやり方で回っている」人には、変える動機が見えないのです。これは現場担当者の意識の問題ではなく、展開の設計の問題です。全体展開の前に、で1業務を自動化して「効果」を見せる実績を作るのが一番早い方法です。

失敗パターン⑤：過剰期待による幻滅

使い始めた頃、「これで月報は自動化できる」「会議資料は全部AIに作らせよう」と思っていました。試してみると、出てきた内容は「骨格だけで肉がない」ものが多く、結局大幅に修正が必要で、「手で書いた方が早かったかも」と感じることが何度もありました。

ChatGPTが最も価値を発揮するのは「ゼロから書き始める作業のコスト」を下げることです。完成品を出すものではありません。「AIが完成させる」ではなく「AIが速く下書きを出して、自分が仕上げる」——この役割分担が定着すると、ChatGPTの価値が安定して感じられるようになります。

実際に私の場合、月報の文章部分を「たたき台を出してもらって自分が修正する」スタイルに切り替えてから、作業時間が4〜5時間から1時間以内に落ち着きました。

ChatGPTが製造業で使える領域・使えない領域

5つの失敗パターンをまとめると、「使える業務」と「難しい業務」が見えてきます。

業務タイプ	ChatGPTとの相性	備考
月報・日報の文章作成補助	◎	データを渡してたたき台作成
なぜなぜ分析の視点出し	○	現場情報を詳しく渡す必要あり
手順書・標準作業書の初稿	○	現場固有の手順の追記が必要
設備トラブル記録の整理	○	データ数30件以上が前提
外観検査の精密判定	×	専用画像認識システムの領域
需要予測・統計的推論	△	データ品質整備が先決
社内規格値との照合	×	根拠が必要な判定はChatGPTに向かない