AIベンダー契約で危ない条項はどこか|学習利用・入力データ・出力利用の見方
契約審査・承認・監査・稟議を、ひとつのOSで。
属人化しがちな契約レビューを、誰でも同じ品質で処理できる仕組みに。法務・営業の現場でそのまま使えます。
AIベンダーとの契約は、一見すると普通のSaaS契約と似ています。しかし実際に条項を読み始めると、「入力したデータが学習に使われるのか」「出力はどこまで自由に使えるのか」「第三者の権利を侵害したとき誰が責任を取るのか」など、従来のSaaS審査では出てこなかった論点がいくつも絡み合っています。
これらは、利用規約・プライバシーポリシー・DPA(データ処理補足契約)・モデル利用ポリシーといった複数の文書に分散して書かれていることが多く、どれか一つだけを読んでも判断できません。本稿では、AIベンダー契約で特に注意すべき「学習利用」「入力データ」「出力利用」の3つの核心論点について、条文の読み方を実務視点で整理します。
※本稿は「AIベンダー契約審査シリーズ」の第2話です。シリーズ全体の俯瞰は、親記事AI導入を法務はどう審査するか|最初に見るべき論点総まとめをご参照ください。なお本稿は、2026年3月31日に公表された「AI事業者ガイドライン第1.2版」(経産省・総務省)を前提としています。
1. AIベンダー契約で見落としやすい3つの核心論点
AIベンダー契約の審査で実務上つまずくポイントは、ほぼ次の3点に集約されます。
- 学習利用:自社が入力したデータが、ベンダー側のモデル改善・再学習に使われるか
- 入力データの扱い:入力したデータ(プロンプト・添付ファイル・ログ)の保存期間、アクセス権、再利用の範囲
- 出力の利用・権利帰属:AIが生成した出力を商用利用できるか、権利関係がどう整理されるか、第三者権利を侵害した場合の責任
従来のSaaS審査では、サービス提供に必要な範囲で顧客データを利用することが当然の前提で、論点は主にセキュリティと可用性でした。一方、AIサービスでは「ベンダーが顧客データを用いて自社モデルを強くする」というビジネス構造が加わるため、データの利用目的・範囲が大きく広がります。ここを曖昧にしたまま契約してしまうと、汎用モデル学習に機密情報が混入し、機密情報管理上の懸念や、後から経路を説明しきれないリスクが生じることになります。
用語の整理 ― 曖昧にしてはいけない5つの言葉
| 用語 | 本稿での意味 |
|---|---|
| 入力データ | 利用者がAIに入力するプロンプト、添付ファイル、API経由で送信するデータ一式。会話ログを含むことが多い。 |
| 出力 | AIが生成した応答・生成物。テキスト、画像、コード、要約結果などを含む。 |
| 学習利用/モデル改善 | 入力データや出力を素材として、ベンダーが自社のAIモデルを追加学習・微調整・評価に用いること。 |
| 再利用 | 学習以外の目的(品質改善のためのレビュー、安全性モニタリング、統計分析など)でベンダーが入力データや出力を保持・利用すること。 |
| オプトアウト | 学習利用や再利用を利用者側で「拒否」できる仕組み。設定画面、API設定、プラン選択、契約書の特約などで実現される。 |
これらの用語は、ベンダーによって微妙に定義が異なります。「学習利用」と書かれていても、実は評価用途まで含んでいるケースもあります。条項を読むときは、必ず「この文書内でどう定義されているか」を先に押さえてから、具体的な義務条項に進んでください。
2. 学習利用条項の見方
学習利用条項は、利用規約の本文、データ処理補足契約(DPA)、製品別ポリシーなどに分散しています。ひとつの契約書だけを見て判断するのは危険です。
学習利用の類型別整理表
AIベンダーの学習利用は、おおむね次の5類型に分かれます。契約プランや利用形態(UI/API)によって類型が変わることがあるため、自社が実際に使う形態がどの類型に当たるかを確認することが出発点です。
| 類型 | 特徴 | 実務上の留意点 |
|---|---|---|
| ①原則学習利用 | 入力・出力を原則ベンダーが学習素材として利用。個人プランや無料プランに多い。 | 営業秘密・個人情報・秘匿性の高い契約書等を入力するのは原則不適。業務利用ではこの類型を避けるのが基本方針。 |
| ②デフォルト学習+オプトアウト | 原則は学習するが、設定で拒否できる。 | オプトアウトの設定手順・有効範囲(過去データも対象か)・設定ログの保存可否を必ず確認。 |
| ③デフォルト非学習(ビジネスプラン等) | 有償プランやエンタープライズプランでは、原則学習に使わないと定めるタイプ。 | 「原則」の例外がどこまで広いか(安全性審査、不正利用対応など)を要確認。契約終了後のデータ取扱いも別項で確認。 |
| ④API利用は学習しない/UI利用は学習する | 同じベンダーでも利用経路で取扱いが変わる。 | 自社の業務フローで「どの経路で入力しているか」を棚卸しする必要がある。 |
| ⑤完全学習不使用(契約保証) | 契約書で学習利用を明示的に禁じ、違反時にベンダーが責任を負うタイプ。 | 最も保守的だが、プラン料金が高額になる傾向。本番業務・機微データ利用ではこの類型を選ぶべき場面も多い。 |
学習利用条項で必ず読み取るべき論点
- 「誰の」何を学習に使うか:入力データか、出力か、操作ログか。範囲が広いほど注意。
- 「どのモデル」の学習に使うか:汎用モデルか、顧客専用モデルか。汎用モデル学習は他社への影響可能性もあり、慎重な判断が必要。
- オプトアウトの実効性:設定ボタンで止まるのか、別途書面申請が必要なのか。
- 学習済みモデルからのデータ削除:多くの場合、学習に使われた後に「モデルから抜く」ことは技術的にほぼ不可能。この点が利用前の判断で決定的に重要。
法的背景の補足:著作権法30条の4と実務の接点
日本では、著作権法30条の4を踏まえ、情報解析目的の著作物利用が広く許容される場面があります。もっとも、同条には「著作権者の利益を不当に害することとなる場合」の例外があり、文化庁の「AIと著作権に関する考え方」(2024年)などでも、特定のクリエイターの作風を狙い撃ちした学習や、既存のデータ販売市場と直接衝突する場合は議論の対象となり得ることが示されています。また、著作権法の議論はあくまで著作権上の許容性の問題であり、契約上の入力データの取扱い、個人情報保護法、不正競争防止法(営業秘密)の問題は別途検討が必要です。加えて、「ベンダーがどのようなポリシーで学習用データを収集しているか(オプトアウト表明されたコンテンツを除外しているか等)」は、レピュテーション・AI倫理の観点でも確認ポイントとなります。
3. 入力データ条項の見方
入力データに関する条項は、「学習利用」とは別個に成立する独立した論点です。たとえ学習には使わないと明示されていても、入力データは相当期間ベンダー側に保存され、レビューや不正利用監視のために人間がアクセスできる設計になっていることがよくあります。
入力データ条項で最初に押さえるべき4点
- 保存期間:入力・出力ログが何日間、どのリージョンに保存されるか。
- アクセス権者:ベンダー従業員・サブプロセッサ・法執行機関が、どの条件でアクセスできるか。
- 再利用範囲:学習以外の目的(安全性審査、不正利用対応、品質改善、統計)でどう使われるか。
- 契約終了後の扱い:退会後のデータ消去期限、バックアップの保持期間、証跡としての残存。
「Zero Retention(ゼロ・リテンション)」のトレードオフ
セキュリティ重視の企業が求める「入力データをベンダー側に一切保存しない」というZero Retention契約には、見落とされがちなトレードオフがあります。保存を完全にゼロにすると、ベンダー側の不正利用監視(Abuse Monitoring)も機能しなくなるため、次のような結果を招くことがあります。
- 社員が不適切なプロンプトを入力して規約に抵触した場合、事後的な原因究明ができない。
- 逆にベンダーから、監視不能を理由に「より厳しい利用制限」が課される。
- インシデント発生時に、ベンダー側のログ提出が得られず、社内調査が難航する。
Zero Retentionは強力な選択肢ですが、「誰が、どのログをどの目的で保持するか」を社内で再設計する前提とセットで考える論点です。契約文言だけで決めるのではなく、社内のモニタリング体制・DLP運用と合わせて判断することが求められます。
個人情報・営業秘密への橋渡し
入力データに個人情報が含まれる場合、個人情報保護委員会(PPC)の注意喚起を踏まえた適法性整理が必要になります。具体的には、利用目的の特定、第三者提供・委託該当性、要配慮個人情報の取扱いなどが論点となり、学習利用の有無は個人データ提供該当性や利用目的との関係に影響するため、学習利用条項の読み方と無関係ではありません。営業秘密(不正競争防止法)の観点でも、入力行為そのものが秘密管理性を失わせるのではないかという論点があります。この点はシリーズ次回(個人情報・営業秘密編)で詳述します。
入力データ・出力利用・権利帰属のチェック表
| 確認項目 | チェック内容 | 優先度 |
|---|---|---|
| 入力データの保存期間 | 何日間/何か月間、どこに保存されるか。機微情報を含む場合はゼロリテンション契約の可否も確認。 | 高 |
| 入力データへの人の閲覧可否 | モデレーション・安全性審査目的でベンダー従業員が閲覧し得るか。閲覧ログの記録はあるか。 | 高 |
| サブプロセッサ | どのクラウド・どの再委託先に渡るか。国・地域が明示されているか。 | 高 |
| 学習利用の有無 | 入力・出力が汎用モデルに学習されるか。オプトアウトの有無・手順・有効範囲。 | 高 |
| 出力の商用利用 | 生成物を業務利用・二次配布・顧客への提供に使えるか。 | 高 |
| 出力の権利の扱い | 出力に対する権利をどう整理しているか。ベンダーが非独占的利用権等を保持していないか。 | 中 |
| 第三者権利侵害の補償 | 出力が第三者の著作権等を侵害した場合、ベンダーが補償するか。補償の上限・除外事由は何か。責任制限(Cap)の例外扱いか。 | 高 |
| UI/API別の条件差 | ブラウザ利用とAPI利用で、学習・保存・アクセスの条件に差があるか。 | 中 |
| 契約終了後のデータ | アカウント削除後、どの時点で入力データ・出力・ログが消えるか。 | 高 |
| プランごとの差異 | 個人/Team/Enterpriseでデータ取扱いが変わるか。社内で使うプランと契約審査対象プランが一致しているか。 | 高 |
4. 出力利用・権利帰属条項の見方
AIベンダー契約の出力条項は、主に次の3つのレイヤーで読み解きます。
(1) 出力の利用権限
多くのベンダーは「出力は利用者が自由に使ってよい」と表現します。しかし実際には、ベンダーが「サービス運営目的で」非独占的に利用できる権利を留保しているケースがあります。守秘性の高い出力(例:秘密保持義務のある相手にだけ開示する予定の分析結果)をAIで作った場合、ベンダー側が同じ出力を内部でどう扱うかは重要な論点です。
(2) 商用利用の可否・制限
出力には「特定業界向けの用途禁止」「実在人物の同定禁止」「自動意思決定に使う場合の制限」など、用途制限が付くことがあります。自社の利用目的と照らして、契約条項の網にかかっていないかを確認する必要があります。
(3) 権利帰属と第三者権利侵害 ― 「存在しない権利の譲渡」問題
多くのベンダー規約は「出力を利用者に譲渡する」と規定していますが、ここには法的な空洞があります。人間が創作に関与していないAI生成物には、そもそも著作権が発生しないというのが現在の支配的な解釈であり、ベンダーが「存在しない権利」を利用者に譲渡するという条文には、法的効力の観点から限界があります。
実務的には、譲渡文言に加えて次の2つの構成を確保するほうが実態に即した保護になります。
- non-assertion(権利不主張):ベンダーは、将来にわたって出力に関して利用者に対し権利を主張しない旨の明文化。
- 第三者ライセンスの禁止:ベンダーは、同一または実質的に同一の出力を、自ら利用し、または第三者にライセンスしない旨の明文化。
また、AI出力が既存の著作物と類似する、あるいは商標・肖像権・パブリシティ権・個人情報等を侵害するリスクは技術的にゼロにできません。ここで最大の論点となるのが補償(IP indemnity)の実効性です。
(4) 補償(IP indemnity)の実効性 ― 責任制限Capの罠
補償条項があっても、一般的な責任制限条項(Limitation of Liability)の網にかかっていると実効性が大きく減退します。中堅AIベンダーの多くは、補償を含むベンダーの責任総額を「過去12か月の利用料金」などで上限設定しています。月額数万円のSaaS利用では、著作権侵害訴訟の弁護士費用すら賄えません。したがって、補償条項の有無だけでなく、知的財産権侵害に関する補償を責任制限条項の例外とすることの交渉可否が、実務上の重要論点となります。
権利帰属や補償条項の読み方の基礎は、業務委託契約の知的財産権条項の記事および取引基本契約書における知的財産権非侵害保証・補償条項の記事も併せて参照してください。
5. 実務で危ない条項パターン
AIベンダー契約で実際に見られる、要注意の条項パターンを整理しました。これらが見つかったら、即座に交渉・代替案検討の対象にします。
危ない条項パターンと確認ポイント一覧
| 条項パターン | 典型的な書き方 | なぜ危険か/確認ポイント |
|---|---|---|
| ①広範な再利用権 | 「ベンダーは、サービス改善、研究、統計その他の目的のため、入力データおよび出力を利用できる」 | 「研究」「その他」が学習利用を含み得る。用途を列挙型に狭める交渉が必要。 |
| ②オプトアウトが任意規定扱い | 「当社は、利用者の求めに応じ、学習利用を停止することがある」 | 「停止することがある」は義務ではない。実効性を条文上担保する必要。 |
| ③プラン変更で条件変わる | 「本条は、プランの種別により異なる取扱いとなる場合がある」 | 契約審査時のプランと、現場利用時のプランが一致しているか棚卸しが必要。 |
| ④出力への非独占ライセンス留保 | 「利用者はベンダーに、出力を利用・複製・公表する非独占的かつ無償のライセンスを付与する」 | 業務で生成する機微文書を、ベンダーが自社の宣伝素材等に使う余地が残る。 |
| ⑤補償の広範な除外 | 「利用者のガイドライン違反、改変、第三者素材の持込み等に起因する場合、補償は適用されない」 | ほとんどのケースが除外に読める書き方になっていないか。実効性の検証が必要。 |
| ⑥契約終了後も長期保持 | 「本契約終了後も、法令遵守・不正利用調査のため、合理的な期間、データを保持することができる」 | 「合理的な期間」の目安が不明な場合は具体期間を明記させる。 |
| ⑦準拠法・裁判管轄が不利 | 「本規約は米国カリフォルニア州法に準拠し、同州連邦地方裁判所を専属管轄とする」 | 紛争時の実効性を著しく下げる条項。重要ベンダーでは交渉対象とする。 |
| ⑧DPA・ポリシーの一方的変更権 | 「ベンダーは、通知のみで本DPA・関連ポリシーを変更できる」 | 変更後の条件に拘束される仕組みのため、重要変更は同意を要するよう交渉。 |
| ⑨責任制限Capの適用 | 「本契約に基づく補償を含む一切の責任は、過去12か月分の利用料金を上限とする」 | 第三者権利侵害の損害は、利用料金とは比較にならない巨額となり得る。知的財産権侵害の補償は責任制限の対象外とする交渉が必要。 |
| ⑩秘密保持条項との矛盾 | 「本規約の定めは、両者間で締結された秘密保持契約に優先する」 | NDAで「一切の開示禁止」としていても、AI規約の「学習利用」が優先されてしまうリスク。優先順位の整理が必須。 |
6. ベンダーへ確認すべき質問
条項だけ読んでも判断がつかない場合は、書面で明確に確認します。口頭の説明は契約上の効力を持たないため、必ず「メール・質問票」など文書で残すのが基本です。
ベンダーへの確認質問リスト
- 当社のプランにおいて、入力データと出力は、ベンダーの汎用モデルまたは顧客別モデルの学習に使用されますか。
- 学習に使用される場合、学習を停止するオプトアウト機能はありますか。オプトアウトは過去データにも適用されますか。
- 入力データと出力は、どのリージョンに、何日間保存されますか。ゼロリテンション契約は可能ですか。ゼロリテンションとした場合、不正利用監視との関係はどう整理されますか。
- 安全性審査・不正利用対応の目的で、ベンダー従業員が入力データを閲覧できる条件は何ですか。閲覧ログは残りますか。
- サブプロセッサ(再委託先)の一覧と、追加・変更時の通知・同意手続を教えてください。
- 入力データから個人情報を自動的に検知・マスキングする機能は備わっていますか。プロンプト内の機微ワードのフィルタリング/置換は可能ですか。
- 出力を業務利用・顧客提供・商用利用する場合、制限はありますか。
- 出力が第三者の著作権・商標権・肖像権等を侵害した場合、ベンダーによる補償はありますか。補償の上限・除外事由は何ですか。当該補償は、責任制限条項(損害賠償の上限)の例外として扱われますか。
- UI(ブラウザ)利用とAPI利用で、データ取扱いに差はありますか。
- 契約終了・アカウント削除後、入力データ・出力・ログはいつ、どのように消去されますか。バックアップを含みますか。
- 当社が利用中に、DPA・モデル利用ポリシーが一方的に改訂される場合、どのような通知・同意プロセスが取られますか。
7. 契約審査だけに頼らない ― 技術的ガードレールの併用
コラム:法務審査を補完する「技術的ガードレール」
契約書での合意には限界があります。ベンダーが「学習しない」と表明していても、従業員が個人アカウントでログインしてしまえば、その利用は契約の外側で行われます。契約審査とセットで、次のような技術的対策を並行検討することが実務上望ましい姿です。
- CASB/DLPによる制御:許可された法人アカウント以外でのAIサービス利用をブロック。個人情報・機密ワードを含む送信データを検知・遮断する。
- APIゲートウェイの設置:プロンプトがベンダーに到達する前に、社内のゲートウェイで個人情報や機密ワードを検知・置換する。ログも社内で保持。
- RAG(検索拡張生成)の活用:機密性の高いデータは学習やプロンプトに直接載せず、社内DBに閉じた状態でRAGによって参照させ、データ流出経路を最小化する。
- アクセスログの社内保全:Zero Retentionを選択してベンダー側のログを落としたとしても、社内側で誰がどのプロンプトを投げたかの記録を残す設計とする。
AI事業者ガイドライン第1.2版が強調する「Human-in-the-Loop」も、契約上の合意だけでなく、こうした技術的・運用的な仕組みと組み合わせて初めて実効性を持ちます。
8. チェックリスト
ベンダー規約確認時の条項チェックリスト
以下の各項目について、利用規約・プライバシーポリシー・DPA・モデル利用ポリシー等を通読し、「該当条項の有無」「自社の利用形態との適合性」を確認します。一つでも確認できない項目があれば、ベンダーに書面で質問するのが基本動作です。
- □ 入力データがベンダーのモデル改善(学習)に使われるかが明記されているか
- □ 学習利用のオプトアウトが可能か、その手順が明確か
- □ 契約プランにより、データ取扱いが変わる旨の規定があるか
- □ 出力に商用利用制限・用途制限がないか
- □ 出力についてベンダーが非独占的利用権等を主張していないか
- □ 出力による第三者権利侵害について、ベンダーの補償規定があるか
- □ 補償が責任制限条項(損害賠償の上限)の例外として扱われているか
- □ 契約終了後も、入力データやログが保持される期間・目的が明記されているか
- □ API利用時とUI利用時で、条件差がないか(ある場合は差異が明示されているか)
- □ 入力データ・出力のアクセス権者(従業員・サブプロセッサ・法執行機関)が明示されているか
- □ サブプロセッサ一覧とリージョンが開示されているか
- □ DPA・モデル利用ポリシーの改訂手続が定められているか(一方的な変更でないか)
- □ 準拠法・裁判管轄が、実効性の観点から受容可能か
- □ 個人情報・営業秘密の取扱い方針が、自社の社内ルールと整合するか
- □ AI規約と既存NDAの優先順位が整理されているか
9. 関連記事
【テンプレ付】生成AIガバナンスの作り方|法務のAI利用ルール・契約チェックリスト
AIベンダー契約で見えた学習利用・入力データ・出力利用の論点は、社内のAI利用ルールや契約チェックリストに落とし込んで初めて運用できます。本テンプレ付き記事では、AIガバナンス規程のひな形、利用ガイドライン、契約チェックリストを一式で整理し、ベンダー契約審査と社内ルール整備を同じ基準でつなぐことができます。
ベンダー契約の論点整理を、社内の運用体制まで落とし込みたい法務担当者・管理部門担当者を想定しています。
10. まとめ
AIベンダー契約は、従来のSaaS契約の延長ではなく、「データ」と「モデル」をめぐる新しい論点群を持つ契約類型として審査する必要があります。特に重要なのが次の3点です。
- 学習利用:入力データと出力がベンダーのモデル学習に使われるか、オプトアウトは実効的か
- 入力データ:保存期間、アクセス権者、サブプロセッサ、Zero Retentionのトレードオフ、契約終了後の扱い
- 出力利用・権利帰属:商用利用の可否、権利構成(譲渡+non-assertion+第三者ライセンス禁止)、補償が責任制限Capの例外になっているか
そして実務上もう一つ重要なのが、利用規約だけを読んで判断しないこと、そして契約上の合意だけに頼らず、技術的・運用的なガードレールと組み合わせて設計することです。DPA・モデル利用ポリシー・プライバシーポリシー・プラン別の補足ドキュメントを横断的に確認し、CASB/DLP・APIゲートウェイ・RAGといった社内側の仕組みとセットで、はじめて条件の全体像が見えます。
次回以降は、入力データに含まれる個人情報・営業秘密の取扱いや、AI出力の社内利用ルールの設計について、より実務に踏み込んで整理していきます。
🔍 関連ガイドへ進む
この記事と関連度の高い実務ガイドをまとめています。次に読むならこちら。
一次整理/マスキング/論点チェック/運用引継ぎ/稟議一枚化まで、
個別課題から少しずつ軽くしていく入口です。
