デジタルトランスフォーメーション(DX)に向けてAIソフトウェアの開発契約を締結する際の留意点

IT・情報セキュリティ
福岡 真之介弁護士 西村あさひ法律事務所

 デジタルトランスフォーメーション(DX)による事業の変革を目指し、人工知能(AI)を用いたシステムを活用するために、ベンダと契約を締結することになりました。契約締結にあたり、特にどのような点に気を付ける必要があるか教えてください。

 AIソフトウェア開発契約をベンダと締結するにあたっては、まず、従来のソフトウェアと大きく異なるAI技術の特性を理解したうえで契約することが重要です。機械学習を利用したAIソフトウェアは、データに基づき帰納的に作成するソフトウェアであることから、以下の特徴があります。

  1. 学習済みモデルの内容・性能が開発開始時点では確定できないことが多い
  2. 学習済みモデルの内容・性能等がデータに依存する
  3. ノウハウの重要性が特に高い
  4. 各種生成物についてさらなる再利用のニーズが高い
  5. 探索的なアプローチが採用されやすい

 また、ユーザ(開発の依頼者)とベンダ(開発者)の立場が異なることから、各当事者は、相手方の立場も理解したうえで、落としどころを探りながら交渉に臨むことが重要です。AIソフトウェアの契約交渉でも知的財産の帰属が問題になりますが、知的財産は複数の者が同時に利用でき、利用によって減少しないという特性があるため、「権利帰属ではなく、利用条件にフォーカスする」というアプローチで、落としどころを見つけるように努めることが望ましいでしょう。

解説

目次

  1. AIソフトウェアの特徴
  2. AIソフトウェア開発で問題になる点
  3. AIソフトウェア開発契約に関する法律と交渉のポイント
    1. 権利関係・利用条件に関する規定
    2. AIソフトウェアの完成義務・品質
    3. 責任分配に関する規定
  4. まとめ

AIソフトウェアの特徴

 現在、主に機械学習を利用したAI技術を利用したソフトウェア(以下「AIソフトウェア」)について、多くの企業が開発・活用に取り組んでいます。

 最近のAI技術の核となる機械学習は、データから結論を推論するという帰納的なものであり、プログラムを条件と命令で記述する従来型の演繹的なソフトウェアの基本技術思想と根本的に異なります。このようなAIソフトウェアには以下の特徴があります。

  1. 学習済みモデルの内容・性能が開発開始時点では確定できない
    学習済みモデルを生成する際に、学習用データセットからどのような学習済みモデルが作成されるかは、学習用データセットや学習の方法に大きく依存することから、事前に予測することが難しく、開発開始時点では学習済みモデルの内容や性能が確定できない傾向があります。

  2. 学習済みモデルの内容・性能等がデータに依存する
    学習済みモデルの生成は、学習用データセットの統計的性質に基づくものであるため、その性能は学習用データセットに依存することになります。

  3. ノウハウの重要性が特に高い
    AIソフトウェアの特徴は「学習」することにあり、学習にはノウハウが重要です。そのため、学習済みモデルの生成・利用過程において、ユーザおよびベンダの有する様々なノウハウが利用され、最終的に生成される学習済みモデルの性能に大きく影響します。

  4. 各種生成物についてさらなる再利用のニーズが高い
    学習済みモデルは、データを投入・追加することで新たな学習済みモデルを生成し、精度を上げることが可能です。また、他の目的に転用することが可能な汎用性を持つものもあります。そのため、従来のプログラムと比較して、より多くの場面で研究開発あるいは商業目的での再利用が可能です。

  5. 探索的なアプローチが採用されやすい
    学習済みモデルの生成においては、ある学習用データセットを、学習用プログラムに学習させます。期待した結果が得られない場合には、学習用データ・学習方法・モデルを手直しし、再度学習させて、学習済みモデルの改善を図り、これを満足がいくまで繰り返すという試行錯誤的な手法がとられることが一般的です。

 このような特徴を有するAIソフトウェアの開発は、従来型のシステム開発・ソフトウェア開発の考え方がそのまま当てはまらず、AIソフトウェアの開発を依頼するにあたって、ユーザはその点を理解する必要があります。

従来型のソフトウェア AIソフトウェア
技術的性質 演繹的アプローチ
(動作原理が把握しやすい)
帰納的アプローチ
(動作原理の把握が困難)
開発対象確定 しやすい 契約初期は困難
性能確定・保証 しやすい 未知の入力データに対する
性能保証が技術的に困難
事後的な検証等 しやすい 困難
データへの依存 低い 内容・性能等が
学習用データセットに左右される
ノウハウの重要性 高い より高い(対象が多い)
生成物再利用の需要 高い より高い(対象が多い)

出典:経済産業省「AI・データの利用に関する契約ガイドラインの概要」(2019年7月)

AIソフトウェア開発で問題になる点

 AIソフトウェア開発においては、ビジネスに関するデータを有しているユーザがベンダに対してデータを提供することが一般的です。そのため、ユーザは、AIソフトウェア開発の成果物である学習済みモデルなどについて、「自分たちが資金とデータを提供しているのだから、学習済みモデルは自分たちのものなのは当然」「自分たちが資金とデータを提供した学習済みモデルを、ライバル企業に使われたくない」と考え、学習済みモデルの権利は自分たちが確保するという動きに出ることがあります。

 他方で、ベンダは、学習済みモデルの権利をユーザに全部取られてしまうと、そのなかには自分たちが過去に作成したプログラムやノウハウが入っていることから、今後の開発に支障が生じることになります。また、学習済みモデルの権利をユーザに全部取られてしまうと、開発した学習済みモデルを、他社に提供するなど「横展開」をするという収益モデルが成り立たなくなってしまいます。

 このように、ベンダとユーザとの間の契約交渉において、利害が対立することがあります。ユーザとベンダの立場をあげると以下の図表のとおりです。

出典:経済産業省「AI・データの利用に関する契約ガイドラインの概要」(2019年7月)

 このような利害の対立を背景に、契約に関して問題になりやすい点として以下があげられます。

  1. 提供されるデータ等の品質、第三者への提供の可否等
  2. 開発完了の成否または完成義務の有無
  3. 成果や開発途中で生じた知的財産に関する権利の帰属・利用条件
  4. 開発したAI技術を利用したソフトウェアの品質

AIソフトウェア開発契約に関する法律と交渉のポイント

 AIソフトウェア開発契約の具体的な内容を検討するにあたっては、AI技術の特性を前提としたうえで契約することが重要です。各当事者は、相手方の立場も理解したうえで、落としどころを探りながら交渉に臨む必要があります。

権利関係・利用条件に関する規定

 学習済みモデルの生成・利用に際しては、生データ・入力データ、学習用データセット、学習用プログラム、学習済みモデル、AI生成物、ノウハウ等について、権利帰属や利用条件が問題となることが多く、その権利関係や利用条件をあらかじめ検討しておくべきです。権利帰属についてユーザとベンダの間で折り合いが付かない場合であっても、知的財産は複数の者が同時に利用でき、利用によって減少することはないという特性から、「権利帰属ではなく、利用条件にフォーカスする」というアプローチにより、両当事者の落としどころを見つけることを考えるべきです

 「念のために」とか「何かあったときのために」といった曖昧な理由で権利を要求することは、相手方の開発のインセンティブを奪ったり、交渉決裂のリスクを孕んでいます。単なる不安感や社内的なメンツだけのために無意味に権利を欲しがることは、弊害が大きく避けるべきでしょう。

(1)生データ

 生データは無体物であるため、所有権の対象となりません(民法206条、85条参照)。もっとも、著作権法や不正競争防止法などにより保護を受ける可能性はあります。

 しかし、そのような場合を除き、データの利用について、法令上の明確な定めがあるわけではなく、契約による定めや知的財産としての保護がない限り、データに現実にアクセスできる者は自由に利用することができます。したがって、データに現実にアクセスできる者による利用を制限したいのであれば、契約で明示的に禁止する必要があります

(2)学習用データセット

 学習用データセットや、その前段階としての教師データ 1 などのデータも無体物であり、上記の生データと同様に、権利関係や利用条件を契約で定めることが重要です。
 学習用データセット等は、生データの収集・蓄積とこれに対する一定の処理・加工にそれぞれ相当の費用・労力が投下されて生成されることも多く、契約上の権利帰属や利用条件は、交渉上の重要な課題となることがあります。これらについても当事者の利益のバランスを考慮して定めるべきでしょう。

(3)学習用プログラム・推論プログラム

 学習用プログラム・推論プログラムといった「プログラム」は、ソースコード部分は、著作権法の要件を満たせば、プログラムの著作物として著作権法上の保護を受け、また、特許法上の要件を満たせば、物の発明として特許法の保護を受けることができます。原則として、著作権や特許を受ける権利を取得するのは創作者・発明者であるため、ベンダが開発したプログラムについて著作権が生じる場合、一次的には、その著作権はプログラムの創作者であるベンダに帰属することが多いといえます。そのうえで、ユーザがベンダから著作権を譲り受けたり、利用許諾を受けることが必要である場合には、契約で定める必要があります。

(4)学習済みモデル

 学習済みモデルの法的な意義は一義的に明らかではなく、定義を整理することが交渉等のうえで有用です。
 学習済みモデルに関する知的財産権の帰属や利用条件は、交渉上の主要な課題となりますが、十分に検討したうえで利用条件等を定めることが重要です。
 また、学習済みモデルの再利用により、これと異なる学習済みパラメータ等を有する学習済みモデル(再利用モデル)を生成することが可能です。再利用モデルの生成の諾否等についても契約に定めることも検討すべきでしょう。

(5)学習済みパラメータ

 学習済みパラメータは、人間が「思想又は感情を創作的に表現したもの」(著作権法2条1項1号)とは言い難いこと等から、これに著作権法上の保護が及ばない可能性があります。そのため、これを生成したベンダにはその利用や管理の自由が原則として認められることを前提に、ベンダとユーザの間で利用条件を交渉し、契約に定める必要があります。

(6)ノウハウ

 学習用データセットや学習済みモデルの生成ノウハウ等の取扱いが交渉の対象となることがあります。
 ノウハウは、データと同様に無体物であり、所有権の対象とはなりません。ノウハウの利用についても、法令上の明確な定めがあるわけではなく、データと同様に知的財産としての保護がない限り、ノウハウの開示を受けた者等、ノウハウに現実にアクセスできる者が自由に利用できます。そのため、ノウハウの利用を制限したいのであれば、契約で明示的に禁止する必要があります。なお、契約以外の法的保護(知的財産としての保護)の方法としては、不正競争防止法による営業秘密や限定提供データとして保護することが考えられます 2

AIソフトウェアの完成義務・品質

 AI技術の特徴から、AIソフトウェアの完成義務・品質を契約締結時に明確に定めることは一般論としては困難といえます。そうしたなか、完成義務・品質に関してどのようにベンダの義務を定めるのか、あるいは努力義務として定めるのかを検討する必要があります。また、品質についてのユーザとベンダの認識を良く擦りあわせておくことも重要です。品質については、利用目的によって確保すべき品質が異なることや、品質の中には明確に定めることが困難なもの(たとえばAIの公平性)があることは留意が必要です。
 AIソフトウェア開発において、PoC 3 段階を経ていれば、PoC段階の終了時において完成可能性や品質についてある程度目途が立ち、品質についての認識のすり合わせができる可能性はあります。
 なお、AIソフトウェアの品質については、国立研究開発法人産業技術総合研究所の「機械学習品質マネジメントガイドライン」や、AIプロダクト品質保証コンソーシアム(QA4AI)の「AIプロダクト品質保証ガイドライン」などで現在議論が進められています。

責任分配に関する規定

 学習済みモデルの生成や利用に関し、たとえば開発が途中で頓挫したり、学習済みモデルによる何らかの誤りが生じたりした場合の責任分配については、以下の3点が主に問題となります。

  1. 開発が途中で頓挫した場合や期待した性能が達成されなかった場合の責任
  2. 事故を起こし、第三者に損害を与えた場合の責任
  3. 第三者の知的財産権を侵害した場合の責任

 ①については、契約においてAIソフトウェアの完成義務や品質・性能の保証を定めているか否かと関係してきます。ベンダが、AIソフトウェアの完成や品質・性能を保証していない場合には、これらの責任をベンダに追及することは困難となります。ベンダは、AIソフトウェアの特徴から、これらの保証をしないこともよくあるため、そのような場合には、ユーザとしては、当事者の認識をすり合わせたり、PoC段階を経るなどによってリスクを下げることが考えられます。

 また、②について、生じた結果を当事者に帰責できるか否かについて、結局事案に応じてケースバイケースで判断せざるを得ず、事前に精緻に規定することは困難であるのが通常です。ベンダはリスク管理の観点から損害賠償についての免責・上限規定を求めてくることもあるので、ユーザとしてはそれが合理的か判断することが重要でしょう

 ③については、ベンダに知的財産権の非侵害を保証させるか否かという問題ですが、スタートアップなどについては、このような責任を負わせても、支払能力や知的財産権の専門家がいないことも多いと思われます。そのような条項を設ける実効性を踏まえて検討すべきでしょう。

まとめ

 DXを進めるにあたっては、AIソフトウェア開発をスムーズに進めることが必要となることも少なくありません。そのAIソフトウェア開発にあたっては、AIソフトウェアの特徴を踏まえ、相手の立場を理解したうえで、ユーザとベンダのお互いがウイン・ウインとなるように契約交渉を進めていくことに留意すべきであり、それが会社のDXの推進に繋がることになると考えられます。


  1. AIソフトウェア開発にあたり、学習済みモデルを生成するためにAIにあらかじめ与える正解データ付きの学習用データ ↩︎

  2. 不正競争防止法による営業秘密、限定提供データとしての保護については、「DX推進における保有データの利用時・ベンダー提供時の法的検討事項と、事業部への伝え方」も参照 ↩︎

  3. Proof of Concept:戦略仮説・コンセプトの検証工程 ↩︎

無料会員登録で
リサーチ業務を効率化

1分で登録完了

無料で会員登録する