生成AIの開発時に注意すべき法的リスクとは?
知的財産権・エンタメ 更新
目次
昨今、大規模言語モデル(LLM)や拡散モデル(Diffusion Model)等を活用した生成AI(Generative AI)が大きな注目を集めています。その一方、生成AIによる著作権やプライバシー侵害等、生成AIをビジネス利用する際の法的問題が議論されています。
本記事では、生成AIを用いたサービスのAI開発・学習段階で検討すべき、知的財産、パーソナルデータ、人格権関連の権利・利益に関するデータの取扱い等を含む法的留意点を解説します 1。
生成AIサービスの開発・利用の流れ
(※)関連する技術内容によって異なり得るものの、一般的には、①大規模な学習用データセット(事前学習用データセット)を用いて基盤モデルを開発する、②基盤モデル生成用データセットとは別の再学習用データセットを用いて、基盤モデルの再学習(転移学習やファインチューニング等)をし、個別の適用事例に応じた調整をすることで、生成AI(生成モデル)を開発する、③ユーザが、生成モデルに対して、プロンプト等の指示やデータ(インプット)を入力して、AI生成物を出力する、④ユーザが、出力されたAI生成物を利用する、との流れを経ることが多いと思われます。
AI開発・学習段階における検討ポイント
AI開発・学習段階では、基盤モデルまたは生成モデルが、学習用データセットを用いて開発されます(関連記事「生成AIとは? 各国の法規制、ビジネス利用時の法的論点をわかりやすく整理」もご参照ください)。もっとも、これらモデルのいずれについても、学習用データセットを準備して学習を実施し、その成果としての学習済みモデルを得るとの工程は変わらないため、検討が必要な問題は多くの場合重なります。
実務上問題になることが少なくないのは、以下のデータを学習に用いる場合です。
- 知的財産に関するデータ(主として著作物データ)
- 個人情報を含むパーソナルデータ
- 人格権関連の権利・利益に関するデータ
- 契約上取扱いが制限されるデータ
上記のデータを学習に用いる場合の注意点について、それぞれ解説したうえで、さらに、その他留意点を解説します。
「知的財産に関するデータ」を学習に用いる場合
知的財産に関するデータについては、特に、著作物データを開発・学習に用いることの可否が議論されることが少なくありません。知的財産の保護制度としては、ほかにも特許法、意匠法、商標等がありますが、以下の理由により、著作権法の適用が問題になることが多い状況です。
- 特許法については、データそのものは、発明として保護されないことが一般的です(ただし、データそのものではありませんが、たとえば、データの処理方法に関する特許が登録されている場合には別途特許権侵害や無効事由の有無を検討する必要があります)。
- 意匠法は、操作画像や表示画像を画像意匠として保護しているものの、その保護範囲は、生成AIで問題となる、学習済みパラメータやコンテンツにまで及びません。
- 商標法については、商標権侵害を構成し得るのは商標的使用に限られ、AI開発・学習段階における利用はこれに当たらない場合がほとんどと考えられます。
なお、不正競争防止法については、主に契約が問題になる場面では、契約条項の解釈の問題と論点がほぼ重なります。そのため、5(契約上取扱いが制限されるデータ)で説明します。
著作権侵害となる場合
著作権法上、著作権者は、著作権法21条〜28条に定める支分権を享有しており(同法17条1項)、他者が支分権の保護対象となる利用を無断で行った場合には、原則として著作権侵害になります。たとえば、著作権者は、複製権を専有するものとされており(同法21条)、また、二次的著作物を作成する権利(同法27条)を有していますので、著作権者に無断で著作物を複製または改変する場合には、これらの支分権を侵害する可能性があります(なお、このほかにも、著作者人格権や著作隣接権の侵害が問題になることもあります)。
著作権法に違反する場合、民事上は差止請求(著作権法112条)または損害賠償請求(民法709条)等の法的救済の対象になり得るとともに、侵害者には刑事罰が科せられる可能性(著作権法119条以下)もあります。
著作権侵害とならない場合
もっとも、著作権者の許諾を得ない著作物の利用であっても、著作権法30条以下に定められる権利制限規定が適用される場合には、著作権侵害は生じません 2。AI学習・開発の段階では、著作権法30条の4と47条の5の適用が問題になることが少なくありません。
(1)著作権法30条の4
- 基本的な理解
生成AIのAI開発・学習段階における著作物の複製または改変に関しては、「著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」(いわゆる「非享受目的利用」)に著作権の行使を制限する著作権法30条の4の適用が往々にして問題となります。その条文は以下のとおりです。
第30条の4 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
ここで「享受」とは、著作物の視聴等を通じて、視聴者等の知的・精神的欲求を満たすという効用を得ることに向けられた行為(プログラムの著作物については実行行為)を指すと考えられており、その該当性を判断する際には、行為者の主観に関する主張のほか、利用行為の態様や利用に至る経緯等の客観的・外形的な状況も含めて総合的に考慮されます。
著作権法30条の4は、非享受目的利用も形式的には著作物の利用であることを前提としつつも、著作権者が有する経済的な価値は、著作物に表現された思想または感情を享受することにあるとの理解を前提に、非享受目的利用は、著作権者の対価回収の機会を通常損なわない行為であるとして、著作権者の権利行使を制限しています。著作権法30条の4は第1号から第3号に非享受目的が認められる場合を列挙していますが、これら各号に該当しなくとも、非享受目的が認定できるのであれば、著作権法30条の4の適用を受けます。つまり、同条の適用の有無を判断するためには、まず、①同条各号に該当するかを判断し、②仮に該当しない場合には、別途非享受目的の有無を判断するとの2段階の過程を経ることが有用な場合は少なくないでしょう。
機械学習については、同条2号が定める「情報解析」(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うこと)に含まれると考えるのが一般的です。また、機械学習では、多くの場合、著作物の表現についての人の知覚による認識を伴う形で著作物が利用されないため、情報解析に該当しなくても、著作権法30条の4第3号や、同条柱書の非享受目的利用が認められることが多いでしょう。
著作権法30条の4の下で許される利用の態様には制限がないので、たとえば、機械学習のために、学習用データセットの販売やアノテーションのための複製等を行うことも可能です。また、著作権法30条の4の適用の基準は、享受目的があるか否かであるため、享受目的がない限りは、営利目的が併存していてもかまいません。
- 柱書と各号の関係
著作権法30条の4柱書と各号の関係について、近時、享受目的が併存する情報解析の有無が議論されることもあります。
特に、文化審議会著作権分科会法制度小委員会が2024年3月に公開した「AIと著作権に関する考え方」(以下「考え方」といいます)では、「一個の利用行為には複数の目的が併存する場合」があることを前提に、情報解析の用に供する場合等の非享受目的で行われる場合であっても、この非享受目的と併存して、享受目的があると評価される場合は、法第 30 条の4は適用されない」との解釈が示されています。
具体的には、考え方20頁では、次のような場合には、享受目的があると認められる(=非享受目的があると認められない)とされています 3。
既存の学習済みモデルに対する追加的な学習(そのため に行う学習データの収集・加工を含む)のうち、意図的に、学習データに含まれる著 作物の創作的表現の全部又は一部を出力させることを目的とした追加的な学習を 行うため、著作物の複製等を行う場合。
(例)AI 開発事業者又は AI サービス提供事業者が、AI 学習に際して、いわゆる 「過学習」(overfitting)を意図的に行う場合
このような、著作権法30条の4各号に該当する場合であっても享受目的と非享受目的の併存 4 を認める説(以下「併存説」といい、これを認めない立場を「非併存説」といいます)は、実質的には、著作権法30条の4の適用を柱書の適用の問題と位置づけるものです。つまり、両説の対立軸は、一個の利用行為には複数の目的が存在するという事実論ではなく、著作権法30条の4各号が、情報解析を非享受目的利用の例示であることを明示的に定めているにも関わらず、さらに、享受目的を観念することが、同条の解釈としてそもそも成り立つのかという法的な解釈論にあります。当否は措くとして、併存説に立つ場合 5、実務上は、以下の各点に留意することが重要でしょう。
第1に、併存説に立つ場合でも、AI開発・学習段階における著作物データの利用可能な範囲が、非併存説と比較して制約されるとは限りません。併存説では、AI開発・学習段階における享受目的の有無の判断に際しては、利用段階の事情の考慮が重要となりますが 6、非併存説でも利用段階での侵害態様次第では、規範的主体論等の理論構成により、開発事業者によるAI開発・学習段階の著作物の利用に関する責任を追及する余地があるためです。
つまり、利用段階における生成AIシステムやサービスの出力態様が、AI生成・開発段階における著作物利用の適法性の判断要素となる点においては両説に大きな違いはなく 7、そして、利用段階で既存著作物が高頻度で出力されるような事情がなければ、AI開発・学習段階において著作権法30条の4が適用されない場面は限定的と思われます。
第2に、機械学習は、一般的に「情報解析」(著作権法30条の4第2号)に該当しますが、同時に、人の知覚による認識を伴わない著作物の利用がなされている(著作権法30条の4第3号)と評価可能な場合も少なくないと思われます。享受目的と非享受目的の併存は、人の知覚による認識があることを前提にするため(知覚による認識がない場合には利用目的を持つことができません)、著作権法30条の4第3号に該当する場合には、併存は成り立ちません。そのため、人の知覚による認識があるか否かが先決的な問題になる場面も想定されますが、知覚による認識を肯定する要素と、享受目的を肯定する要素との間に実質的にどのような違いがあるのかも含めた検討がより重要になるでしょう。
- 30条の4但書の適用
著作権法30条の4柱書または各号に該当する場合であっても、同条但書によれば、「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合」には、権利制限が認められず、結果として、著作権者の許諾のない利用は著作権侵害を構成するため、いかなる場合が「著作権者の利益を不当に害する」といえるのかが問題になります。
著作権法30条の4は、対象となる著作物の各利用が非享受目的であることを前提としたうえで、著作者に与える不当な利益の有無を考慮するとの構造を有している以上、不当性の有無で問題とされる著作物の利用市場も、あくまでも非享受目的の利用市場を想定していると理解するならば、不当性が認められる場合は限定的と考える余地があると思われます(不当性の考慮要素も、著作物の種類・用途・利用態様に限られています)。他方で、著作権法30条の4の但書の適用に際しては、より幅広い利益を考慮可能であるとする説もあり、議論がある状況です。
この点、文化庁著作権課が2019年10月24日に公開した「デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方」では、このような不当性の有無は、著作権者の著作物の利用市場と衝突するか、将来における著作物の潜在市場を阻害するか、という観点から判断されるとしたうえで、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に、当該データベースを情報解析目的で複製等する行為」を著作権者の利益を不当に害することとなる具体例として挙げています。
APIを介したデータ取得に関する著作権法30条の4但書の適用について、考え方25頁では、次のとおり説明されているものの、①APIからのデータ取得がいかなる場合に、データベースの著作物の複製等に該当するといえるのか(APIからのデータ取得がデータベースの著作物の複製等の利用行為に当たらないならば、データの複製等が別途著作権侵害を構成しない限り、権利侵害がなく但書を含む著作権法30条の4の適用の余地はありません)、②無償と有償の両方の適法な情報入手の手段がある場合に無償の手段を用いて情報入手することが、権利者の利益を不当に害すると評価できるのか等が問題になり得ます。換言すれば、APIを用いたデータ取得であるからといって、著作権法30条の4の但書に直ちに該当するとまでは評価できないでしょう。
また、考え方26頁および27頁は、以下に述べるとおり、①AI学習のための著作物の複製等を防止する技術的な措置が講じられており、かつ、②あるウェブサイトの情報を含むデータを情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合には、当該ウェブサイト内に掲載する多数のデータをクローラにより収集する行為が著作権法30条の4但書に該当する可能性を指摘しています。もっとも、①の要素が著作権法30条の4但書の判断に際していかなる意味を持つかは必ずしも明らかではなく、その要否も含めて、今後の議論が必要になると思われます。
(2)著作権法47条の5
著作権法47条の5第1項2号は、情報解析(コンピュータによる情報処理)により新たな知見または情報を提供することを目的として、適法に公表された著作物を軽微に利用する場合には著作権者の利益を不当に害しない限りにおいて著作物の利用を認めています。具体例としては、論文を剽窃した際に、剽窃された既存著作物の記述箇所を示すAIを提供する場合が挙げられます。このような既存著作物の利用は、形式的には著作権侵害が問われ得るものの、著作権法47条の5が適用される場合には、権利者の許諾がなくとも、適法に利用できます。
そして、著作権法47条の5第2項では、このような軽微利用の準備のための著作物の複製、公衆送信および複製物の頒布は、著作権者の利益を不当に害しない限りは可能とされています(なお、この段階での利用は軽微である必要はありません)。そのため、生成AIの利用態様によっては、その前段階である、AI開発・学習段階でも、著作権者の許諾なく、既存著作物を情報解析(機械学習)に用いることできます。ただし、著作権法47条の5の適用を受けるためには、著作権法施行令7条の4や施行規則第4条の4および5等に定められる各要件(たとえば、文献調査や専門家の意見照会等)を充足する必要があるため、注意が必要です。
契約による利用制限の可否(オーバーライド問題)
権利制限規定、特に著作権法30条の4については、その適用により自由利用可能となった著作物の利用を契約でさらに制限できるのかという、いわゆる「オーバーライド問題」の検討が必要になることがあります。
(1)オーバーライド問題とは
たとえば、あるウェブサイトで公開されている画像(著作物と仮定します)を情報解析に利用する場合、著作権法30条の4が適用されるのであれば、著作権者の許諾は不要です。もっとも、「本ウェブサイトのデータは当社に無断で利用することを禁止します」等の文言(以下「利用禁止文言」といいます)が明記されている場合、ウェブサイトの管理者の許諾がなければ、当該画像を情報解析に利用できないことになりかねません。そうすると、結果として、著作物の情報解析への利用が制限され、著作権法30条の4を設けた意味がなくなるのではないかが問題になるのです(ここでは著作権法30条の4を例としましたが、他の権利制限規定でも同様の問題は生じ得ます)。
このような事態は、一見すると、契約が著作権法の権利制限規定を上書き(オーバーライド)しているように見えるため、オーバーライド問題といわれることがあります。
オーバーライド問題をどのように捉えるかは見解の相違があり得ますが、著作物の自由利用を制限する利用禁止文言のような条項が公序良俗(民法90条)に反し無効とされる余地がないかが議論の対象となることが少なくありません 8。
(2)オーバーライド問題の検討の手順
オーバーライド問題は、利用禁止文言が著作物の利用者を拘束する場合にはじめて問題になります。そのため、上記(1)の例でいえば、利用禁止文言が掲載されているものの、データが一般に公開され、ユーザ登録等の積極的な行為なく自由に取得可能となっているような場合には、そもそも、ユーザが利用禁止文言の適用を受けないと整理されるケースもあり得るため、注意が必要です。また、利用禁止文言が適用される場合には、その解釈により、想定している著作物の利用が制限されるかの検討が必要でしょう。
上記の各検討にもかかわらず、仮に利用禁止文言が適用される可能性がある場合、著作権法30条の4の適用が認められ、著作権法上の問題がクリアできる場合でも、著作物の学習への利用は契約違反を構成して、差止請求や損害賠償請求の対象になり得るため、利用禁止文言の有効性の検討が必要です。
この点、2022年2月に公表された、新たな知財制度上の課題に関する研究会「新たな知財制度上の課題に関する研究会報告書」は、著作権法30条の4の趣旨やAIの社会的意義、利用者に与える不利益の程度、当事者間の信義・公平等を考慮のうえで、「個別の事情における諸般の事情を考慮する必要があるものの、AI学習等のための著作物の利用行為を制限するオーバーライド条項は、その範囲において、公序良俗に反し、無効とされる可能性が相当程度あると考えられる」と結論づけています 9。その当否は措くとしても、この見解を踏まえても、オーバーライド条項の有効性は、個別具体的な事情により判断される点は変わらず、オーバーライド条項が無効になる可能性が示唆されているにとどまります 10。そのため、今後の議論状況の注視がやはり重要でしょう。
「パーソナルデータ」を学習に用いる場合
同意の必要性
個人情報を含むデータを取り扱う場合、個人情報取扱事業者は、本人に通知しまたは公表した利用目的の範囲内でしかこれを取り扱うことができず(ただし、合理的な関連性がある場合には利用目的の変更が可能な場合もあります。個人情報保護法17条、18条)、利用目的を超えて学習のためにデータを取り扱う場合には本人の同意が必要となるのが原則です。そのため、個人情報が含まれるパーソナルデータを取り扱う際には、プライバシーポリシーにおける利用目的の記載を確認し、その目的の範囲内で利用することの確認が必要です。
また、個人情報を取得する際には、本人からの同意の取得は一般的には不要であるものの、要配慮個人情報を取得する場合には事前同意が必要です(同法21条2項)。
特に、一事業者に対するものではありますが、生成AIとの関係では、個人情報保護委員会が、要配慮個人情報取得の禁止に関連して以下の点を注意喚起しています 11。
(1)機械学習のために情報を収集することに関して、以下の4点を実施すること。
- 収集する情報に要配慮個人情報が含まれないよう必要な取組を行うこと。
- 情報の収集後できる限り即時に、収集した情報に含まれ得る要配慮個人情報をできる限り減少させるための措置を講ずること。
- 上記①及び②の措置を講じてもなお収集した情報に要配慮個人情報が含まれていることが発覚した場合には、できる限り即時に、かつ、学習用データセットに加工する前に、当該要配慮個人情報を削除する又は特定の個人を識別できないようにするための措置を講ずること。
- 本人又は個人情報保護委員会等が、特定のサイト又は第三者から要配慮個人情報を収集しないよう要請又は指示した場合には、拒否する正当な理由がない限り、当該要請又は指示に従うこと。
(2)利用者が機械学習に利用されないことを選択してプロンプトに入力した要配慮個人情報について、正当な理由がない限り、取り扱わないこと。
上記注意喚起において、個人情報保護委員会は、①で事前のフィルタリングを、②で事後の是正措置の実施を求めていますが、③で上記各措置を実施したにもかかわらず要配慮個人情報を事実上入手した場合の措置を求めています。事案によると思われますが、上記の記載ぶりからは「必要な取組」や「要配慮個人情報をできるだけ減少させるための措置」を取っている限りにおいては、収集情報の中に要配慮個人情報が含まれていることのみをもって、直ちに法令に違反するとみなしていない可能性があると思われます。
この点は、今後の実務運用にも左右され、不確実なところは残らざるを得ませんが、たとえば、ウェブクローリング等により学習用のデータを収集する場合等、要配慮個人情報が含まれ得る場合には、上記各指摘事項を適切に履践し、かつ、その履践状況を証明ができるように記録を残しておくことが重要になるでしょう。
プライバシーポリシーや利用規約での定め
生成AIを含むAIの開発のために、自社が保有する個人情報を用いることを検討する際に、自社のプライバシーポリシーや利用規約上定められる個人情報の利用目的が必要以上に狭い場合、あるいは、個人情報保護法の個人情報にとどまらないパーソナルデータの利活用を自発的に禁じている場合、これらの規定が自社ビジネスの足かせとなることがあります。
このような制約が自社のプライバシーポリシーや利用規約等に課せられている場合には、定型約款規制(民法548条の4)や、個人情報保護法の利用目的の変更等の観点から適切に変更が可能か(同法17条2項)、あるいは変更できない場合にどのような対応を取り得るか等を検討する必要が生じ得ます。
この場合、契約の問題は定型約款規制、プライバシーポリシーの問題は個人情報保護法と、峻別可能な場合は取るべき対応が明確ですが、たとえば、利用規約の中に個人情報の取扱いが定められている等、契約と個人情報保護法の問題が渾然一体となるような場合には、これら両方を満たすような対応が可能か検討する必要が生じるでしょう。また、個人情報の利用目的規制の適用が問題であるならば、第三者提供がない事案であれば、利用目的の変更により制限のない仮名加工情報(同法2条5項)の活用もあり得るでしょう。
「人格権関連の権利・利益に関するデータ」を学習に用いる場合
顔や姿態等の容貌(以下「肖像」といいます)を写したデータを生成AIの開発(機械学習)に利用できるかが、実務上問題になることがあります。このような他者の肖像の取扱いについては、肖像権やパブリシティ権の侵害の問題がすぐに思い浮かぶところです。
肖像権およびパブリシティ権はいずれも、憲法13条後段の幸福追求権に基礎を置く人格権に由来する権利または利益です。ただし、肖像権が肖像の有する精神的価値に着目するのに対し、パブリシティ権は財産的価値に着目するとの性質の違いがあることから、両者は「渾然一体として人格権に由来する権利を構成するものではない」と考えられています 12。
自らの肖像に関して、肖像権またはパブリシティ権の侵害が認められる場合、当該個人は、侵害者に対する侵害行為の差止請求または損害賠償請求等の法的な救済を受けることができます。
しかし、これらの人格権あるいは人格権に由来する権利・利益の侵害については、法律上の明文の定めを欠き、その保護が主に裁判例の積み重ねにより図られてきた経緯から、具体的な保護の要件や範囲は必ずしも明確ではありません。そのため、他者の肖像を学習に用いる場面で、はたして肖像権やパブリシティ権の侵害が認められるかは今後の議論の集積を待つ必要がありますが、現時点の議論状況を踏まえると、生成AIのAI開発・学習段階での適用関係は、以下のとおりになると考えられます。
肖像権
肖像権については、和歌山毒入カレー事件(最高裁(一小)平成17年11月10日判決・民集59巻9号2428頁)によれば、「みだりに自己の容ぼう等を撮影されない」または「自己の容ぼうを撮影された写真をみだりに公表されない」利益として位置づけられることが一般的です。また、ピンク・レディー事件(最高裁(一小)平成24年2月2日判決・民集66巻2号89頁)では、人の肖像について「個人は、人格権に由来するものとして、これをみだりに利用されない権利を有する」とも説明されています。
もっとも、肖像権が具体的に何を保護利益とするかは見解の統一をみていません。肖像権の保護法益は、具体的な事案に応じて、プライバシー、名誉感情、私生活上の平穏等異なり得るところであり、その保護法益が特定される場合には、当該保護法益の性質を踏まえた基準を定立したうえで差止請求または損害賠償請求の可否の判断が求められるでしょう 13。
また、そのような保護法益が特定されない場合には、和歌山毒入カレー事件最高裁判決の枠組みに従い、「被撮影者の社会的地位、撮影された被撮影者の活動内容、撮影の場所、撮影の目的、撮影の態様、撮影の必要性等を総合考慮して、被撮影者の上記人格的利益の侵害が社会生活上受忍の限度を超えるものといえるかどうかを判断」することになります 14。しかし、あくまでも一例にすぎず、具体的な事案に応じて必要な要素を検討対象に加えたうえで考慮することになります。
ただし、以上の見解を踏まえたとしても、プライバシーの侵害、名誉感情の侵害、私生活上の平穏等が主に問題とするのは、個人の肖像を無断で撮影・公開する場面がほとんどと思われますので、学習に際して肖像権による保護の対象になるデータセットを用いたとしても、撮影・公表の要素がなければ、肖像権侵害は直ちには認められないと思われます。
パブリシティ権
パブリシティ権は、ピンク・レディー事件最高裁判決で、以下のとおり整理されています。
この最高裁の整理は、パブリシティ権について、以下の観点から、肖像権侵害のような総合考慮を行うのではなく、侵害が認められる類型を、商品化の場面(上記①と②)と、広告利用の場面(上記③)にできるだけ限定するものと考えられています 15。
- 財産的利益を生み出す肖像等の使用態様に着目すればその範囲を一定のものに限定することが可能であること
- コンテンツビジネス等における取引対象となるから高い予測可能性が求められること
- 表現の自由や報道の自由・創作の事由等との調整が問題になるから外延ができるだけ限定されかつ明確である必要があること 等
なお、ピンク・レディー事件最高裁判決には金築裁判官の補足意見が付されており、上記3類型以外にも「これらに準ずる程度に顧客吸引力を利用する目的が認められる場合」にパブリシティ権侵害が認められる可能性を示唆しているものの、あくまでも「準ずる程度」とされているため、パブリシティ権による保護の対象範囲は必ずしも広くはないと思われます。
生成AIの開発(学習)の場面では、対象となるデータの商品化や広告利用が問題にならないため、一般論としては、学習へのデータ利用のみをもって、パブリシティ権の侵害を構成するおそれは低いと思われます。ただし、事案によっては、利用の過程まで含めた全体観察の余地はあるでしょう(もっとも、全体観察が必要となる事案では生成・利用段階における権利侵害が直接的な問題となり、AI開発・学習段階は準備行為的な位置づけを有するにとどまるでしょう)。
「契約上取扱いが制限されるデータ」を学習に用いる場合
データ提供契約による利用制限
上記2から4に該当するか否かを問わず(ただし、上記2から4が問題になる場面ではむしろ契約がない場合が少なくないでしょう)、一般的に、学習用データセットの提供を他者から受ける場合には、データ提供契約を締結することが少なくありません。
このようなデータ提供契約では、開示を受けたデータの利用の利用目的の制限(たとえば、基盤モデルの再学習に限定した利用)等のデータの利用に関する制約や、データの対価、あるいはデータを基に生成された学習済みモデルの帰属やこれを用いたサービス提供に関するプロフィットシェア等が定められることがあります。
データ提供契約を締結したうえで開示を受けたデータについては、契約に違反する利用は差止請求や損害賠償請求等の対象になり得るため、想定される学習へのデータ利用が契約条件に違反するかの検討が重要です。
不正競争行為への該当性判断
対象データが、データ提供者の営業秘密または限定提供データに該当する場合には、契約上の条件に違反した自社利用または第三者提供は、図利加害目的が認められ不正競争行為を構成する場合があります(不正競争防止法2条1項7号・14号。ただし、限定提供データの使用については任務違背が必要です)。もっとも、契約の解釈に争いがある場合には図利加害目的が認定されないこともあります。また、対象データについて、不正な経緯を知って取得した場合はもとより、知らないで取得した場合でも、不正な経緯を事後的に知った場合には、以後の使用や開示が不正競争行為に該当することもあるため注意が必要です(同法2条1項5号から9号、12号から16号等)。
特に、技術上の情報についての営業秘密に関しては、営業秘密それ自体のみならず、一定の不正競争行為により生じた「物」を譲渡等(電気通信回線を通じた提供を含みます)する行為も不正競争行為に該当するとされています(同法2条1項10号)。不正競争防止法の「物」にはプログラムが含まれるため(同法2条11項)、結論としては、営業秘密を構成する学習用データセットを不正に利用して生成された学習済みモデルの利用も一定範囲で制限されることがあります。これに対して、限定提供データについては、まだ、このような規制は導入されていません。
その他の考慮事項
生成モデルの開発を外部に委託する場合の注意点
基盤モデルが一般的に普及している場合、これを自社用に再学習(ファインチューニング等)したいものの、十分な知見がない場合には、生成AIの開発(さらにこれを含むシステムの開発)業務の外部委託が考えられます。そのような場合には、開発・契約方式(請負・準委任)、完成の基準、学習用データセットの取扱い、生成AI(生成モデル)の権利・利用関係(権利の帰属・ソースコード開示・知財保護)等が主に問題になるでしょう。
ただし、基盤モデルの提供者が、ファインチューニング用のクラウドサービスを提供している場合には、上記のようなシステム開発的な要素は薄れることも想定されます。クラウド型のAIサービスでは、技術情報秘匿の観点から、学習済みモデル自体がユーザに開示されず、AI生成物のみが開示されるケースも珍しくありませんが、この場合、モデル自体の権利帰属やソースコード開示等の論点の重要性は事実上後退するでしょう。
基盤モデルと生成モデルの作成者が異なる場合の注意点
生成モデルが、他者が事実上管理するまたは法的な権利を有する基盤モデルを基礎として生成される場合には、基盤モデルを学習に利用することについて、権利処理が必要な場合も想定されます。
この点、基盤モデルを含む学習済みモデルは、一般的には、プログラムとパラメータの組み合わせとして表現されますが、そもそも、基盤モデルに著作物性があるのか、あるいは基盤モデルの利用について契約上の問題はないかとの検討が必要です。
たとえば、基板モデルが、オープンソースソフトウェア(OSS)として提供されている場合にはそのライセンスまたは宣言上、特殊な利用条件が課されていないか(いわゆるコピーレフト型OSSであるか)等の注意が重要でしょう。特に、基盤モデルの中には、プログラムのコード部分とデータ・パラメータ部分で別々の利用条件が設定されているものもあるため注意が必要です。
他方、基盤モデルが、プロプライエタリソフトウェア(非OSS)として提供される場合には、基盤モデル提供者との間のソフトウェアライセンス契約を締結することになるため、基盤モデルのライセンス条件や、生成モデルの権利帰属・利用範囲(特に商用利用が可能か)、その他、両当事者が遵守すべき義務等がその議論の対象になり得るでしょう。
-
本記事は、現時点における筆者の個人的な見解を述べるものであり筆者が所属する団体の見解を述べるものではありません。 ↩︎
-
このほか、権利保護期間が満了している場合等にも著作権侵害は生じませんが、本記事の性質上割愛します。 ↩︎
-
考え方19頁ではRAG入力用データベース構築の際の既存著作物の複製についても享受目的が認められる事を指摘しています。著作権法30条の4の適用が問題になることはたしかですが、実務上基盤モデルの提供事業者以外の事業者がユーザの依頼を受けてこれを構築することも少なくなく、むしろ利用段階の議論として整理することが適切と思われます。 ↩︎
-
著作権法30条の4は、そもそも享受目的の併存という概念を設けておらず、あくまでも享受目体の有無を問題にしているにすぎません。享受目的と非享受目的が併存する場合には、享受目的がないと評価できないと言えば足りるのであって、併存との表現自体ミスリーディングとは思われます。 ↩︎
-
併存説に立つ場合には、結局のところ、著作権法30条の4柱書に該当するか否かでその適用の有無が判断されるので、同条各号が非享受目的使用を例示している意味が極めて限定的となります。 ↩︎
-
考え方21頁では「なお、開発・学習段階における享受目的の有無については、開発・学習段階における利用行為の時点でどのような目的を有していたと評価されるかが問題となることから、生成・利用段階において、AIが学習した著作物と創作的表現が共通した生成物が生成される事例があったとしても、通常、このような事実のみをもって開発・学習段階における享受目的の存在を推認することまではできず、法第30 条の4の適用は直ちに否定されるものではないと考えられる。他方で、生成・利用段階において、学習された著作物と創作的表現が共通した生成物の生成が著しく頻発するといった事情は、開発・学習段階における享受目的の存在を推認する上での一要素となり得ると考えられる。」とされています。 ↩︎
-
なお、併存説に立つ場合には、AI生成・開発段階における享受目的の併存を根拠とする侵害主張と、利用段階における侵害を前提とした規範的主体論等による侵害主張との間には、実質的にいかなる差異があるのかは別途問題になるでしょう。 ↩︎
-
オーバーライド問題は、権利制限規定の強行法規性と結びつけられることがあります。もっとも、仮に著作権法の適用問題は、権利制限規定の適用により解決済みであると評価するならば、そもそも著作権法上の問題が生じないはずであって(仮にオーバーライド条項が無効となった場合でも著作権法違反が認められるわけでもありません)、はたして「オーバライド問題」との呼称が適切であるか自体、検討の余地があります。 ↩︎
-
新たな知財制度上の課題に関する研究会「新たな知財制度上の課題に関する研究会報告書」(令和4年2月)40〜41頁 ↩︎
-
なお、新たな知財制度上の課題に関する研究会「新たな知財制度上の課題に関する研究会報告書」(令和4年2月)47頁は、「例えば、(利用規約に基づく契約が成立している前提で、)当該利用規約にAI学習等のための利用行為が禁止される旨明確に規定されており、かつ、当該利用規約 が利用者に明確に認識することができる態様で表示されている場合に、利用者が「同意」ボタンをクリックするなどの方法により当該利用規約に明示的に同意しているときに、当該利用行為の制限を無効と考えることは当事者間の信義・公平を害するおそれがあるといえる。」とも指摘しています。 ↩︎
-
個人情報保護委員会「OpenAIに対する注意喚起の概要」(令和5年6月2日) ↩︎
-
中島基至「判解」(『最判解民事篇平成24年度(上)(1月~2月分)』(法曹会、2015)29頁) ↩︎
-
公益社団法人商事法務研究会「インターネット上の誹謗中傷をめぐる法的問題に関する有識者検討会 取りまとめ」(令和4年5月)35頁以下 ↩︎
-
公益社団法人商事法務研究会「インターネット上の誹謗中傷をめぐる法的問題に関する有識者検討会 取りまとめ」(令和4年5月)37頁以下 ↩︎
-
中島基至「判解」(『最判解民事篇平成24年度(上)(1月~2月分)』(法曹会、2015)37頁・38頁) ↩︎

西村あさひ法律事務所・外国法共同事業
- IT・情報セキュリティ
- 知的財産権・エンタメ
- 国際取引・海外進出
- 訴訟・争訟
- ベンチャー