OpenAIは2025年10月27日、ChatGPTユーザーの深刻な利用実態の推計を初めて公表しました。同社の初期分析によると、週間アクティブユーザーの約0.15%が自殺に関連する相談をChatGPTに送信していると推計され、この深刻な状況に対応するため、170人以上のメンタルヘルス専門家と協力してAIの対応能力を大幅に改善したと発表しました 。
深刻な利用実態推計が明らかに
今回公表された推計は実に深刻な内容です。OpenAIの初期分析によると、ChatGPTにおいて:
- 週間アクティブユーザーの約0.15%が「自殺の計画や意図の明確な兆候」を含むメッセージを送信
- 週間アクティブユーザーの約0.07%が精神病や躁病の兆候を示す会話を実施
- 全メッセージの約0.05%が自殺願望や意図の明確または暗黙の兆候を含有
ただし、OpenAI自身が「これらの会話は希少で検出・測定が困難」と明記しており、実際の人数は母数や測定方法により大きく変動する可能性があることに注意が必要です 。
GPT-5による確実な改善効果
注目すべき点は、10月3日にリリースされたGPT-5アップデートによる改善効果です 。170人以上のメンタルヘルス専門家との協力により、以下の確実な成果を達成しました:
自殺・自傷関連の対応改善
- 困難な自殺・自傷会話において、GPT-4oと比較して不適切な回答を52%削減
- 1,000以上の自殺・自傷関連会話の評価で91%のコンプライアンスを達成(従来の77%から大幅向上)
メンタルヘルス全般の対応強化
- 困難なメンタルヘルス会話において不適切な回答を39%削減
- 全体として問題のある回答を65-80%削減することに成功
評価方法の詳細と留意点
今回の改善効果測定において重要なのは、評価設計の透明性です。OpenAIは以下の点を明確に説明しています:
困難ケース中心の評価設計
改善効果の測定は「困難ケースを中心としたオフライン評価」に基づいています。これは平均的な日常会話ではなく、意図的に選択された困難な状況での性能を測定するものです 。
OpenAIは「継続的改善を可能にする困難なタスクとして設計された」と明記しており、実際の平均的な使用環境では結果が異なる可能性があることを率直に認めています。
専門家評価体制の透明性
170人以上のメンタルヘルス専門家による評価では、統一された評価基準に基づく厳格な審査が実施されました 。専門家は「最新版のChatGPTが以前のバージョンよりも適切で一貫した対応をしている」と評価しており、複数の専門家間での評価の整合性が確認されています。
技術的な安全システムの導入
OpenAIは敏感な内容を検出すると、自動的により高度なGPT-5モデルにルーティングする新システムを導入しました 。これにより、メンタルヘルス緊急事態に対してより適切で思慮深い対応が可能になっています。
さらに、長時間の会話における安全性も向上し、特に困難な設定においても95%以上の信頼性を維持することが確認されています 。
測定の難しさと継続的改善
OpenAIは今回の発表で、メンタルヘルス関連の会話が「極めて希少で検出・測定が困難である」ことを率直に認めています 。この正直な姿勢は、同社の透明性への取り組みを示すとともに、今後も継続的な改善が必要であることを示唆しています。
実際の開発現場では、このような測定困難な領域での性能向上は技術的挑戦であり、完璧な解決策は存在しないことを認識した上での段階的改善アプローチが重要になります。
社会的責任と業界への影響
この取り組みは、OpenAIが直面している法的課題にも関連しています。同社は現在、ChatGPTとの会話後に自殺した16歳の少年の両親からの訴訟を受けており 、AI企業としての社会的責任が強く問われています。
今回の透明性を重視した発表は、そうした批判に対する具体的で建設的な回答といえるでしょう。評価方法の限界も含めて公開する姿勢は、業界全体の標準向上に寄与する可能性があります。
今後の展望
OpenAIは今後、感情的依存や非自殺性メンタルヘルス緊急事態も標準的な安全性テストに追加する予定です 。この動きは、AI業界全体のメンタルヘルス対応基準を押し上げる可能性があります。
まとめ
今回公表された利用実態の推計は、AIが現代社会のメンタルヘルス問題において担う役割の重要性を示しています。推計値には不確実性が伴い、評価方法にも限界があることを認めながらも、OpenAIの65-80%改善という確実な成果は技術進歩の証です。
評価設計の透明性と測定の困難性を率直に公開したOpenAIの姿勢は、AI業界全体における責任ある開発と情報公開の新たな標準となることが期待されます。完璧でなくとも継続的改善を重視する、建設的なアプローチの好例といえるでしょう。
用語解説
- GPT-5【ジーピーティーファイブ】: OpenAIが開発した最新の大規模言語モデル
- コンプライアンス: 企業や組織が法律や規則、基準などを遵守すること
- オフライン評価: 実際のユーザー環境ではなく、制御された環境での性能測定
- ルーティング: データやメッセージを適切な宛先に自動転送するシステム
最終更新日: 2025年10月28日
※免責事項 本記事に含まれる利用実態の推計値は、OpenAIの初期分析によるものであり、同社も測定の困難性を認めています。また、改善効果の測定は困難ケース中心のオフライン評価に基づくため、平均的な使用環境では結果が異なる可能性があります。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。
Citations: [1] https://openai.com/index/strengthening-chatgpt-responses-in-sensitive-conversations/
[2] https://www.theguardian.com/technology/2025/oct/27/chatgpt-suicide-self-harm-openai
[3] https://openai.com/index/gpt-5-system-card-sensitive-conversations/
[4] https://www.webpronews.com/openai-enhances-chatgpt-for-empathetic-mental-health-support/
[5] https://timesofindia.indiatimes.com/technology/tech-news/openai-claims-over-a-million-users-weekly-discuss-suicides-with-chatgpt/articleshow/124860945.cms
