「ChatGPTで日報の下書きを作らせたら、書いていない数字が出てきた」
これ、私の実体験です。製造業の生産管理を7年担当してから社内SEになった私が、最初にChatGPTを業務で試したときの話です。
「月報の文章部分を書いて」と頼んだら、実際には測定していないはずの「前月比4.7%改善」という数字が堂々と出てきました。愧てて確認すると、もちろんそんな数字はどこにもありません。
最初はすごく焦りました。「私の使い方が悪かったのか」「ChatGPTは製造業には合わないのか」……。
でも、試行錯誤を続けてわかったのは、失敗には5つの決まったパターンがあるということです。そしてそのほとんどは、「使い方と期待値の問題」で、ChatGPT自体が使えないわけではありませんでした。
この記事では、私が製造業の現場でChatGPTを試して詰まった5つの失敗パターンと、それぞれの原因・立て直し策を正直に書きます。「自分だけじゃなかった」と安堵してもらえるだけでも、読んだ価値はあると思っています。
製造業でChatGPTがうまくいかないのは「使い方の問題」だけではない
失敗の種類は5つに分かれる
ChatGPTの「失敗」は、ひとことで「使い方が悪かった」と片付けられないことが多いです。原因を整理すると、以下の5パターンに分かれます。
- プロンプト設計の問題(製造業の文脈が伝わっていない)
- ChatGPTが苦手な業務への誤用(画像判定・精密計算への過信)
- データ品質の問題(「ゴミを入れればゴミが出る」)
- 社内展開の壁(「使ってみて」だけでは誰も動かない)
- 過剰期待による幻滅(「全自動化でやってくれる」と思っていた)
なぜ製造業はChatGPTの難易度が高いのか
製造業の業務は、AI(特に生成AI)にとってやや難易度が高い側面があります。理由は3つです。
- 専門用語と現場固有のルール: Cpk・UCL・LCL・不良率・ロット番号など、製造業特有の用語と文脈が多い。ChatGPTはこれを「正確に知っている」わけではない
- 精度を求められる場面が多い: 品質管理・検査・月報など「数字の根拠が問われる」業務にChatGPTを使うと、精度不足が顔在化しやすい
- 社内ルール・帳票フォーマットが厳格: 「このフォーマットで出して」に対して、AIは自分で適切と判断したフォーマットで出してくることがある
「難しいから使えない」ということではなく、「何に使うかを選ぶ」ことが製造業では特に重要なのです。
失敗パターン①:プロンプト設計の問題(最も多い)
月報の文章を頼んだら榧空の数字が出てきた
最初に話した体験がまさにこれです。「今月の品質月報の文章部分を書いて」と伝えだけで、数字・文脈・業種の背景を渡していませんでした。ChatGPTは「品質月報らしい文章」を生成しようとした結果、それらしい数字を自動的に「補完」してしまったのです。
原因:製造業の業務文脈をAIが知らない
ChatGPTは「言語モデル」であり、あなたの工場のデータ・設備・品番・規格値を知りません。伝えなければ、それらしい内容を自動補完します。「品質月報を作って」は、「この月のCpkデータ・不良件数・前月比をここに貼り付けて、品質月報の文章部分を書いて」と変えなければいけなかったのです。
立て直し策:現場の前提条件をプロンプトに書き込む
失敗を経て、私がたどり着いたプロンプトの書き方は「5W1Hの前提条件を冒頭に書く」です。
【背景】:品質管理担当。部品メーカー、月次の品質会議に提出するレポートを作っている
【目的】:品質月報の文章部分を作りたい
【データ】:(ここに今月のCpk一覧と不良件数を箇条書きで貼り付け)
【条件】:数字は上記データのものだけ使う。データにない数字は絶対に作らない
【出力形式】:500字程度の文章。品質課題と改善方向を含む
この書き方にしたところ、活空の数字が出てくることはほぼなくなりました。
製造業で使えるプロンプトの書き方をもっと知りたい方は、こちらの記事に業務別30本をまとめています。
→ コピペOK!製造業で使えるプロンプト集30選|生産管理7年が業務別に厳選
失敗パターン②:ChatGPTが苦手な業務への誤用
ChatGPT Visionで外観検査を試みた
「画像を見て判定できるなら、外観検査にも使えるのでは?」と思って試してみました。不良品と良品の画像をChatGPT Visionに送り、「これは不良品ですか?」と聴く実験です。結果は惨敗でした。同じ画像を3回送ると判定が「問題なし」「要確認」「おそらく不良」と毎回変わる。実用になる安定した精度はありませんでした。
なぜなぜ分析で的外れな回答が続いた
「この設備で発生した寸法不良について、なぜなぜ分析を5段階でやって」とChatGPTに頼んだことがあります。出てきたのは「作業者のミス」「工具の磨耗」「管理が不十分」という、あまりにも一般的な内容でした。私の設備は特殊な素材を扱う機械で、その特性を知らないChatGPTには、的確な「なぜ」を導くことができなかったのです。
原因:生成AIと精密判定AIの違いを混同している
生成AIであるChatGPTは、「言語的に自然な文章を生成する」ことに特化しています。
| ChatGPTの得意領域 | ChatGPTの苦手領域 |
|---|---|
| 文書作成・整理・下書き | 精密な画像判定 |
| 説明文・手順書の初稿 | 設備固有の知識を要する推論 |
| アイデア出し・構造化 | 根拠っき数値計算 |
| 言語系の整理・要約 | 社内規格値との照合 |
立て直し策:「言語系業務」に用途を絞る
外観検査の自動化はChatGPTではなく、専用の画像認識システム(学習コストと精度保証が必要)の話です。
一方でなぜなぜ分析は、現場の状況を詳しく書いたプロンプトに変えたら改善しました。設備の構造・素材特性・変動のタイミングまで書くと、現場を知った上での分析が出てくるようになりました。
失敗パターン③:データ品質の問題
「汚いExcelデータをCode Interpreterに渡した結果」、出力されたグラフは見た目は綺麗でしたが、実際の傾向と全然合わない。後で見ると、元データに欠損値・入力ミス・日付フォーマットの揺れがあちこちに散らばっていました。
「ゴミを入れればゴミが出る」——これは機械学習の世界でよく言われますが、ChatGPTでも同じです。AIは入力データの品質に完全に依存します。AIを使う前に、手元のデータがどれだけ整っているかを確認することが先決です。
失敗パターン④:社内展開で誰も使わなくなった
自分でChatGPTを使いこなせるようになってから、「みんなにも使ってほしい」と思い、部門に展開しようとしました。ChatGPTのアカウントの作り方と基本的な使い方を説明して、「便利なので活用してみてください」と伝えたのですが……。3週間後にはほぼ誰も使っていませんでした。
「便利そう」だけでは人は動きません。「今の仕事のやり方で回っている」人には、変える動機が見えないのです。これは現場担当者の意識の問題ではなく、展開の設計の問題です。全体展開の前に、で1業務を自動化して「効果」を見せる実績を作るのが一番早い方法です。
失敗パターン⑤:過剰期待による幻滅
使い始めた頃、「これで月報は自動化できる」「会議資料は全部AIに作らせよう」と思っていました。試してみると、出てきた内容は「骨格だけで肉がない」ものが多く、結局大幅に修正が必要で、「手で書いた方が早かったかも」と感じることが何度もありました。
ChatGPTが最も価値を発揮するのは「ゼロから書き始める作業のコスト」を下げることです。完成品を出すものではありません。「AIが完成させる」ではなく「AIが速く下書きを出して、自分が仕上げる」——この役割分担が定着すると、ChatGPTの価値が安定して感じられるようになります。
実際に私の場合、月報の文章部分を「たたき台を出してもらって自分が修正する」スタイルに切り替えてから、作業時間が4〜5時間から1時間以内に落ち着きました。
ChatGPTが製造業で使える領域・使えない領域
5つの失敗パターンをまとめると、「使える業務」と「難しい業務」が見えてきます。
| 業務タイプ | ChatGPTとの相性 | 備考 |
|---|---|---|
| 月報・日報の文章作成補助 | ◎ | データを渡してたたき台作成 |
| なぜなぜ分析の視点出し | ○ | 現場情報を詳しく渡す必要あり |
| 手順書・標準作業書の初稿 | ○ | 現場固有の手順の追記が必要 |
| 設備トラブル記録の整理 | ○ | データ数30件以上が前提 |
| 外観検査の精密判定 | × | 専用画像認識システムの領域 |
| 需要予測・統計的推論 | △ | データ品質整備が先決 |
| 社内規格値との照合 | × | 根拠が必要な判定はChatGPTに向かない |
失敗から立て直した実例
最初に話した「月報作成でChatGPTに活空の数字を書かれた」失敗後、プロンプトを改善した結果はどうなったかを最後に書きます。
改善したプロンプトで再挑戦したところ、月報の文章部分の作成時間が「4〜5時間→1時間以内」に短縮されました。数字の捕造も出なくなりました。変えたことは一つで、「ChatGPTに何を渡すか(文脈・データ・条件)」を丁寧に設計しだけです。
ChatGPTは使い方が変わると、結果が劇的に変わります。「失敗したから使えない」ではなく、「失敗した原因を特定して、使い方を変える」のが一番得策です。
製造業でChatGPTを正しく使うためのプロンプトの書き方(業務別30本)は、Noteにまとめる予定です。公開した際はブログでお知らせします。
まとめ
製造業でChatGPTがうまくいかない理由は、以下の5つのパターンに分かれます。
- プロンプト設計: 製造業の業務文脈を渡していない → 5W1Hの前提を書き込む
- 用途の誤り: 生成AIを画像判定・精密推論に使おうとした → 言語系業務に絞る
- データ品質: 汚いデータを渡した → AI前にデータ整備が先決
- 社内展開: 「便利だから使って」では誰も動かない → 1業務の実績を先に作る
- 過剰期待: 「全自動化」を期待した → 「たたき台製造機」として使う
いずれも「ChatGPTが使えない」のではなく、「使い方と期待値を調整する」ことで解決できます。失敗した経験がある方ほど、原因を正確に把握しているという強みがあります。次の一手を試してみるだけの価値はあります。
製造業でChatGPTを本格活用したい方は、活用事例・プロンプト集の記事もあわせてどうぞ。