
はじめに
AIを開発する過程では、学習済みモデルを始め様々な成果物が生み出されます。ですが、AI開発のプロセスは、ベンダとユーザとの共同開発的な色彩が強いため、成果物について、誰がどういった権利を持つのか?がとても複雑で、理解が難しいですよね。
そうはいっても、学習済みモデルを始め、成果物の権利の所在などは、AI開発契約の当事者にとっては重大な関心事で、適当に済ますわけにはいきません。
そこで今回は、AI開発契約の成果物の中でも特に法的な問題を抱える「学習済みモデル」について、誰にどのような権利が認められるのか?特にコンテンツを保護するための権利である「著作権」が認められるのかといった点を中心に、ITに強い弁護士が解説していきます。
目次
1 AIの成果物
「AI(Artificial Intelligence)」とは、人工的に作られた人間の知能のようなものを指します(もっとも、現状の技術的到達点としては自律的な判断をする「強いAI」までは開発できず、人の機能を一部代替した「弱いAI」のレベルにとどまります。)。
AIは、その開発過程において、いろいろな成果物を生み出します。
主な成果物として挙げられるのは、以下の4つです。
- 生データ
- 学習用データセット
- 学習済みパラメータ
- 学習済みモデル
順に、簡単に確認しておきましょう。
(1)生データ
「生データ」とは、一時的にユーザやベンダなどにより取得されたデータであって、データベースに読み込むことができるように加工・変換処理を施されたものをいいます。
(2)学習用データセット
「学習用データセット」とは、対象とする学習手法による解析を簡単にするために生成された二次的な加工データのことをいい、欠測値や外れ値の除去、正解データなどの付加など、変換・加工処理が施されたものいいます。
(3)学習済みパラメータ
「学習済パラメータ」とは、学習用データセットを使った学習の結果、得られたパラメータ(係数)のことをいいます。
(4)学習済みモデル
「学習済みモデル」とは、学習済みパラメータが組み込まれた推論プログラムのことをいいます。
「推論プログラム」とは、組み込まれた学習済みパラメータを適用することにより、入力に対して一定の結果が出力されることを可能にするプログラムのことをいいます。
これらの成果物について、「特許権」や「著作権」という強力な権利が認められるか、という点は、現状においてはっきりしていませんが、この中でも特に「学習済みモデル」は多くの法的な問題を抱えています。
そこで今回は、この「学習済みモデル」にフォーカスして、さまざまな法的問題点を見ていきたいと思います。
2 学習済みモデルとは?
「学習済みモデル」を改めて説明すると、学習済みパラメータが組み込まれたプログラムのことをいいます。
「学習済みパラメータ」とは、学習によって調整されたパラメータ(係数)のことをいいます。
上の図は、AI開発契約により学習済みモデルが生成されるまでのフローを表したものです。AIは、学習用データセットを読み込むことにより、入力データと出力データの誤差を減らすようにパラメータ(係数)を調整し、この調整を繰り返すことによって学習済みモデルが生成されていきます。
「学習済みモデル」は、以下の2つから成り立っています。
- プログラム部分
- 学習パラメータ
そして、AI開発契約において特に検討すべきは、これら学習済みモデルを構成するプログラム・パラメータが「著作権」によって保護され、それがベンダ・ユーザのいずれに帰属するのか?という点です。
3 著作権とは
(1)著作権
「著作権」とは、本や音楽などのコンテンツ(著作物)を創ったクリエイターに認められる権利で、第三者に無断で利用されたり転載されることを禁止できる権利をいいます。
「著作物」とは、自分の思想や感情を創作的(オリジナリティ)に表現したものをいいます。代表的なものとして、本や音楽のほか、映画、絵画、彫刻、設計図や建築物、ビデオソフトやゲームソフトなどがあります。
そして、この著作権は、以下の2種類に分けて整理することができます。
- 著作者人格権
- 財産権としての著作権
学習済みモデルが著作権によって保護されるか?を考えるにあたり、この2つの違いを理解しておくことは重要です。
①著作者人格権
「著作者人格権」とは、著作者の作品に対する「思い入れ」を保護する権利です。勝手に作品の一部を変更されたり、望んでもいないタイミングで作品が公表されないように作り手を保護してくれる権利です。
例えば、ドラえもんの色味は「青色」ですが、これを勝手に「黄色」に塗り変えることは、この権利で防げます。
②財産権としての著作権
「財産権としての著作権」は、著作物の利用を他人に認めたり(ライセンス)、禁止することのできる権利です。
通常、AI開発契約で問題となるのは、後者の「財産権としての著作権」です。これが学習済みモデルに認められるのか?仮に認められるとして、ベンダ・ユーザのいずれに帰属するのか?が実務では争いになります。
というのも、著作権は一度認められれば、その人に独占的な利用権が発生しますし、また、AI開発においてはベンダとユーザの共同開発的な色彩が強く、いずれに帰属するのか?が一見してわかりにくいからです。
以上のことを前提に、AI開発のプロセスで生み出された学習済みモデルが、著作権によって保護されるのか?を見ていきましょう。
特に、学習済みモデルについては、著作物の中でも「プログラム著作物」といえるのか?が法的には問題となります。
(2)プログラム著作物とは?
「プログラム」とは、パソコンなどの電子計算機を機能させて、一の結果を得ることができるように、これに対する指令を組み合わせたものとして表現したものをいいます。
ざっくりいうと、「コンピュータに書かれた物事の順番」といったイメージです。
このプログラムに著作物性が認められれば、そのプログラムは「プログラム著作物」として著作権法により保護されることになります。
ここでいう「著作物性」とは、生み出した作品について、自分の考えや感情が創作的(オリジナリティ)に表現されているものをいいます。
このように、プログラムであっても、そこに創作性(オリジナリティ)が認められれば、「プログラム著作物」として著作権法により保護を受けうるのです。
AI開発契約においても、AIのプログラムがこの「プログラム著作物」といえる実態をそなえていれば、著作権によって守られることになります。
もっとも、「プログラム著作物」にあたるのか?を検討するにあたり、一見すると、この「プログラム著作物」に該当しそうでも、以下の例のとおり実際には該当しない物がたくさんあります。
①区別すべき「プログラム言語、プロトコル、アルゴリズム」について
著作権法は、あくまで「表現」を保護するための法律です。
そのため、表現に至らない「アイデア」や「表現手段」については、著作権法の保護は受けられません。
具体的には、以下の3つは、「プログラム著作物」にはあたらず、著作権法による保護を受けることはできません。
-
(ⅰ)プログラム言語
(ⅱ)プロトコール
(ⅲ)アルゴリズム
(ⅰ)プログラム言語
「プログラム言語」とは、文字どおり、プログラムを記述するための言語のことをいいます。このような言語は、プログラムを作成するための手段にすぎないため、「プログラム著作物」にはあたらず、著作権法では保護されません。
(ⅱ)プロトコール
プロトコールは、プログラムにおける手順や約束事にすぎず、具体的な表現とはいえないため、「プログラム著作物」にはあたらず、著作権法では保護されません。
(ⅲ)アルゴリズム
アルゴリズムは、プログラムを機能させるためのノウハウであり、表現に至らないアイデアであるため、「プログラム著作物」にはあたらず、著作権法では保護されません。
もっとも、アルゴリズムがプログラムという形で具体的な表現に表れていれば、「プログラム著作物」として認められる可能性があります。
このように紛らわしいプログラム著作物ですが、著作権法で保護されるためには、以下で解説するように、あくまでその対象がオリジナリティの認められる表現物であることが必要になってきます。
②「プログラム著作物」として保護されるための条件
プログラムが「プログラム著作物」として著作権法で保護されるためには、以下の3つの条件をすべて満たすことが必要です。
-
(ⅰ)「思想・感情」といえること
(ⅱ)「創作性(オリジナリティ)」があること
(ⅲ)「表現」されていること
(ⅰ)「思想・感情」といえること
「著作物」であると認められるためには、「思想・感情を伴うもの」であることが必要です。「思想」といっても、高度な哲学的思想を必要とするものではなく、人の「考え」や「気持ち」が伴っていれば十分である、とされています。
ここでいう「思想」には、技術思想(プログラムが達成しようとする機能について、コンピュータを使って実現するための考え方)が含まれると考えられているため、プログラムも思想を表現したものとして著作物にあたる可能性があります。
(ⅱ)「創作性(オリジナリティ)」があること
「創作性がある」とは、作成者の何らかの個性(オリジナリティ)が発揮されているということを意味します。
誰が書いても同じ内容になる簡単なプログラムや、プログラマの間で一般的に知られている指令の組み合わせは、著作物にはあたりません。誰でも作成できるごく簡単なプログラムを著作権法で保護してしまうと、他人がそのプログラムを利用できなくなってしまい技術開発が停滞するためです。
もっとも、プログラムはある機能を実現することを目的として作られるため、プログラムへの表現は、小説や絵画などといった著作物と比べると限定されることになります。
そのため、プログラムに創作性があるか?という判断は簡単ではありません。
いずれにしても、複雑で高度なプログラムについては、その分だけプログラム記述の選択肢が広がるため、創作性が認められる可能性は高くなります。
(ⅲ)「表現」されていること
既に見てきたとおり、著作権法の保護を受けるためには、単なる「アイデア」ではなく、「具体的な表現物であること」が必要です。
そのため、プログラムを開発するための発明やアイデア、考え方、理論、ノウハウ、アルゴリズム等は、著作物に含まれません。
なお、「表現物」であれば著作権法の保護対象となるため、録音や録画などにより表現が物体に固定されている必要はありません。つまり、プログラムがパソコンのメモリやハードディスクに保存されていなくても、著作物の対象となります。
たとえば、プログラマ同士のメールに書かれたソースコードや、会議で話されたプログラムの内容についても、著作権法で保護される可能性があるのです。
学習済みモデルも、以上の3つの条件に合致していれば、「プログラム著作物」にあたり、著作権法によって守られます。
学習済みモデルの内実は、①学習用プログラムと、②学習済パラメータの二つによって構成されていることから、それぞれに分けて検討していきます。
4 問題点①:AIの「学習用プログラム」は著作権で保護されるか?
AIのプログラムには、ニューラルネットワーク(人の脳機能にみられる特性に似た数理的モデル)を始めとして、さまざまな種類があります。AIをコンピュータ処理するためには、このようなニューラルネットワークの構造などをプログラムとして書き込んでいくことになります。
このようにして作られたプログラムは、「表現物」にあたるため、プログラム著作物の対象となり得ます。
そして、このようなプログラムが著作権法の保護対象となるかどうかは、そのプログラムに、
- 思想又は感情
- 創作性(オリジナリティ)
- 表現
が認められるかどうかが基準になりましたよね。
先に見たように、プログラムにおける記述の選択肢が広ければ広いほど、プログラムに創作性(オリジナリティ)が認められ、プログラム著作物として著作権法によって保護を受けられる可能性が高いといえます。
反対に、誰が書いても同じ内容になる簡単なプログラムなどは、記述の選択肢が乏しいため、創作性が認められず、プログラム著作物にはあたらないとされる可能性が高いです。
なお、経済産業省のガイドラインにおいても、
-
学習済みモデルのプログラム部分は、そのソースコードはプログラムの著作物として著作権法上の保護を受け得る
と述べられています。
このガイドラインでは、学習済みモデルのソースコードがオブジェクトコードに変換されていても著作物となり得る、ということも併せて述べられています。
そのため、AIの学習用プログラムについては、プログラムにおける記述の選択肢が広ければ広いほど「プログラム著作物」として保護される可能性が高くなります。
それでは、学習用プログラム部分に学習用データセットを読み込ませることにより生成される「学習済みパラメータ」についてはどうでしょうか?
5 問題点②:AIの「学習済みパラメータ」は著作権で保護されるか?
「学習済みパラメータ」は、AIのプログラム部分に学習用データセットを読み込ませることにより生成され、多くの場合は数値で表現されているにすぎません。
この点パラメータ部分は、プログラム部分との関係ではっきりと区別できる場合もあれば、一体となっている場合もあります。
両者が一体となっているような場合に、パラメータ部分だけを取り上げて、著作権で保護されるかどうかを考えるのはあまり意味がありません。
ですが、たとえば、OSSとして公開されているプログラムを使用して、学習済みモデルを生成したところ、同じOSSとして公開されているプログラムを使用した人が、学習済みパラメータを勝手に使ったような場合を想定するとどうでしょう。
この場合、学習済みパラメータに著作権を有しているかどうかによって、勝手に使った相手に対して問える内容も変わってきます。
そのため、「学習済みパラメータ」が著作権法で保護されるかが問題となるのです。
(1)「プログラム著作物」として保護されるか?
学習済みパラメータが、「プログラム著作物」として著作権法で保護されるためには、先ほど解説した3つの条件(①思想・感情、②創作性、③表現)を満たす必要があります。
①「思想・感情」の表現といえるか?
学習済みパラメータは、AIのプログラムが生成したものであり、そこに思想や感情はないと考えられるため、原則として「思想・感情」の表現とはいえません。
そのため、学習済みパラメータは基本的には、プログラム著作物とはいえず、著作権法によっては保護されないという見解が有力です。
もっとも、学習済みパラメータの数値は、学習済みモデルの作成者が選んだデータや学習回数の設定など、人間の思想が現われたものであるともいえます。
この観点から文化庁は、「コンピュータ創作物」について、人間による
-
(ⅰ)作成の意思
(ⅱ)作成過程における「創作的寄与」
が認められれば、その創作物はコンピュータを道具として創作されたものとして著作物性を肯定する見解を示しています。
この見解によれば、AIが生成した数値であるからといって、それだけで著作物性が否定されることにはなりません。
その結果、学習済みパラメータについても、学習済みモデルの作成者にこの(ⅰ)作成の意思、(ⅱ)作成過程における「創作的寄与」が認められれば、学習済みパラメータであっても、著作物性が肯定され、プログラム著作物として保護される可能性があります。
※なお、コンピュータ創作物に関する文化庁の見解について、詳しく知りたい方は、「著作権審議会第9小委員会(コンピュータ創作者関係)報告書」をご覧ください。
②「創作性(個性)」があるといえるか?
仮に上記文化庁の見解に立ち「学習済みパラメータ」が思想感情の表現といえたとしても、それ自体は学習用データセットをAIの学習用プログラムに入力して学習させ、その調整の結果として得られたパラメータ(係数)であって、単なる数値であるという側面は否定できません。そのため、創作性(個性)があるとはいえず、やはり学習済みパラメータは原則として「著作物」とはいえないという見解があります。
もっとも、学習済みパラメータの取り得る数値や組み合わせは無限であるため、選択の幅は相当に広いということがいえます。
このように、プログラムの創作性について選択の幅があるか否かという観点で判断した場合には、例外的に、創作性が認められる可能性があります。
選択の幅が広い以上、誰でも作ることができるという「一般性」がなくなり、そこにオリジナリティが生まれる可能性があるからです。
なお、経済産業省のガイドラインにおいても、
-
学習済みパラメータは大量の数値データであって、創作性等が認められず、通常は知的財産権(著作権等)の対象にはならない可能性が高い
と述べられています。
③小括
以上のように、学習済みパラメータは、著作物として認められるために必須の「思想・感情」の表現や「創作性」という条件に欠けているとして、基本的には著作権法上の「プログラム著作物」としては保護されないものと考えるのがベターです。
もっとも、学習済みパラメータは、多くのデータが集積されたものであるため、「プログラム著作物」としてはダメでも、「データベースの著作物」として保護されないかという点は、別途検討する必要があります。
以下で見てみましょう。
(2)「データベースの著作物」として保護されるか?
「データベース」とは、事実やデータを編集してコンピュータで検索できるように構成したものをいいます。たとえば、漢和辞典や英単語の辞書、顧客名簿や住所録などが該当します。
著作権法では、このデータベースについて、データの選択または体系的な構成について創作性があれば、著作物として保護するとされています。
以上のことをまとめると、「データベースの著作物」として保護されるためには、
- 情報を検索できる体系的な構成になっていること
- データの選択や体系的な構成に創作性が認められること
という2つの条件をみたす必要があります。
「データベースの著作物」として認められれば、個々のデータそのものではなく、データベース全体が保護の対象となります。
それぞれについて「学習済みパラメータ」にあてはめて見ていきましょう。
①情報を検索できる体系的な構成になっていること
学習済みパラメータは、数値の集合体ではありますが、ニューラルネットワークの各ノード間の結び付きの強さを示す係数にすぎず、検索される対象として作成されたものではありません。
そのため、 著作権法が想定する一般的な「データベース」とは根本的に異なる性質であり、この条件をみたさないと考えられます。
②データの選択や体系的な構成に創作性が認められること
学習済みパラメータの数値は、AIのプログラムが自動で生成するものなので、そもそもデータの選択が行われません。
もっとも、学習済みパラメータが、人間が決めたニューラルネットワークの仕組みで体系付けられる側面があることも否定できませんが、基本的にはデータベースの著作物として保護されるために必要な「データの選択」とは評価できないとされています。
このように、学習済みパラメータは、それが単なる係数であり、検索される対象として作成されたものではないこと、また、この係数はAIプログラムが自動で生成するものであり、データの選択は行われないこと、といった理由で、「データベースの著作物」として認められる可能性は低いと考えられます。
以上のように見てくると、学習済みパラメータが著作権法で保護される可能性は低いということがいえます。
それでは、学習済みパラメータ部分について無断でコピーなどをされた場合に、何ら権利侵害などを主張できないのでしょうか。
(3)「学習済みパラメータ」は一切保護されないのか?
AIの学習済みモデルは、
- プログラム
- パラメータ
という2つの部分から構成されていますが、全体としては1つのプログラムと考えられています。
そこで、考えられるのは、著作権侵害の対象を「学習済みパラメータ単体」とするのではなく、「学習用プログラムと一体となった学習済みモデル」と構成する方法です。
この点については、以下の2つのステップを踏んで検討する必要があります。
- 学習済みモデルそのものに著作権が観念できるか
- プログラムに著作物性が認められ、プログラム著作物として扱われるか
①学習済みモデルそのものに著作権が観念できるか
学習済みパラメータを著作権法上のプログラムとみなすことができれば、プログラムと学習済みパラメータを分ける必要はなくなります。そうすると、「プログラム+学習済みパラメータ」を1つのプログラムとして考え、あとは、このプログラムに著作物性があるかどうかを判断すればよいということになります。
この点、学習済みパラメータはプログラムとセットになることで、コンピュータに対する指令となることができます。どちらかが欠けると、コンピュータに対する指令となることはできません。
そのため、学習済みパラメータが著作権法上のプログラムにあたると考えることは可能です。
そうすると、「プログラム+学習済みパラメータ」を1つのプログラムとして考え、このプログラムに著作物性が認められれば、著作権によってプログラムが保護されることになるため、学習済みモデルそのものに著作権を観念することができるということになります。
②プログラムに著作物性が認められ、プログラム著作物として扱われるか
「プログラム+学習済みパラメータ」の総体としてのプログラムについて、著作物性が認められるかという点は、言い換えると、このようなプログラムにオリジナリティがあるかどうかという問題です。
この点は、学習済みモデルがどのような内容になっているかによって決まってきます。その結果、仮に、学習済みモデルそのものに著作権が認められると、その一部を構成するパラメータを侵害することが、著作権侵害といえるかどうかが問題になってきます。
著作権は、著作物の全体にかぎらず、その一部であってもそこに著作物としての価値が認められれば、その部分についても著作権が及ぶとされているため、パラメータに著作物としての価値が認められれば、パラメータにも著作権が及ぶことになります。
学習済みパラメータに著作物性があるかどうかという問題は、学習済みパラメータの性質をどのように捉えるかによって、結論が分かれます。
単にAIプログラムが自動的に作成したものであると捉えれば、そこにはオリジナリティが認められないため、著作物性は否定されます。
他方で、学習済みモデルの作成者の思想などが表れた学習方法などに基づいて生成されたものと捉えれば、そこにオリジナリティが認められ、著作物性は肯定されます。
以上のように見てくると、学習済みモデルについては著作権を観念できるものの、学習済みパラメータ部分だけが無断でコピーなどされた場合に、その部分に「思想や創作性」があるかどうかという点については、確立された考えが今のところありません。
そのため、著作権侵害の対象を学習済みモデルと構成する方法によっても、パラメータが著作権法によって保護されるかどうかは不透明であると考えます。
さて、これまでは主に「学習済みパラメータ」の保護方法について見てきましたが、プログラム部分と一体となった1つのプログラムとしての学習済みモデルについて、権利侵害を受けた場合に、その点を主張できる主体は誰になるのでしょうか。
言い換えれば、学習済みモデルの「著作者」が誰なのか、という問題です。
AI開発契約においては、著作権が認められるか?という問題と、その著作権が「誰に」帰属するのか?の問題は分かれることがあるため、この点は明確に分けて検討する必要があります。
(4)学習済みモデルの「著作者」は誰か?
「著作者」とは、著作物を創作した人のことをいいますが、これは、形式的に決まるものではなく、実質的に誰が、創作的な表現に携わったかどうかによって決まります。
1つの著作物に対し、著作者も1人であることが一番わかりやすいといえますが、必ずしも1人とは限りません。
AI開発のプロセスには、ベンダ内でもエンジニア、ディレクターなど様々なプレイヤーが関与しますし、ベンダ・ユーザー企業との共同作業的な性質があるため、場合によっては、複数の人で著作物をシェアする「共同著作物」になることもあります。
また、1個の楽曲の「作詞」と「作曲」のように、AI開発契約の成果物の中には、独自の著作物がたんに結合しているだけの「結合著作物」になる場合もあり、この場合、それぞれについて複数の著作者がいることになります。
以下では、
- 共同著作物
- 結合著作物
について、著作者が誰なのかを深堀りしていきましょう。
①共同著作物
「共同著作物」とは、2人以上の者が共同して創作したものであって、その各人の寄与を切り離して個別に利用することができないものをいいます。
プログラム部分とデータ部分とがそれぞれ著作物であることを前提とすると、たとえば、ディープラーニングでは、学習済みパラメータがプログラムと一体的に結びついて作動しており、個別に利用することができないため、「共同著作物」に該当すると考えられます。
この場合は、複数の著作権者が、学習済みモデル全体の著作権を共有することになり、共有著作権としての制限を受けることになります。
②結合著作物
「結合著作物」とは、著作物が1つであるように見えても、実態は一つ一つの著作物が結合しているだけであるため、切り離して利用することができるものをいいます。
この場合は、結合している著作物はそれぞれが独立したものであるため、それぞれについて著作者が存在することになり、一方の著作権者が著作物全体の著作権をもつことはできません。
そのため、 プログラム部分は「プログラムのコーディングを行った人」が著作者となり、学習済みパラメータの部分は「学習作業に創作的に関与した人」が著作者となり、それぞれが学習済みモデルの著作権をもつことはできないことになります。
以上のように、学習済みモデルが著作権法によって保護されるか、保護される場合でも誰が「著作者」になるかどうかは、ケースバイケースです。
そのため、学習済みモデルを確実に保護するためには、次の項目で見ていくように他の保護手段も視野に入れておくことが必要です。
6 「学習済みモデル」の他の保護手段
「学習済みモデル」を保護する手段としては、著作権法以外に以下の2つの方法があります。
- 契約
- 営業秘密
(1)契約
「学習済みモデル」を保護するための最も確実な手段となるのは、「契約」によって保護するという方法です。
既に見てきたように、学習済みパラメータ、ひいては学習済みモデルに著作権が認められるかどうかは不確実で、むしろ原則として著作物とはいえないという見解も有力です。
ただ、これは契約書で特に何も書かなかった場合に法律が定めた「デフォルトルール」にすぎません。
契約書で「学習済みパラメータは著作物とし、ベンダ側の権利とする」などと記載すれば、権利としてきちんと保護することができるのです。
もっとも、契約によって学習済みモデルを保護したとしても、これに違反して第三者が学習済みモデルを無断で使った場合に、その事実を把握するのは困難です。
これは、学習済みモデルがすべてコンピュータシステム内で作動するものであり、外部から無断利用されていることを把握することが困難であるためです。
そのため、学習済みパラメータについて、いくら「契約書で保護しますよ~」と記載しても、第三者による無断利用に対しては実際上権利の侵害を主張しにくいことから、その保護は限定的となります。
(2)営業秘密
「営業秘密」とは、㊙が押してある書類のように、企業独自の生産方法や販売方法、事業活動に有益なノウハウなどに関する情報であって、公に知られていないものをいいます。
守りたい情報が「営業秘密」と言える場合には、不正競争防止法という法律に基づき、業秘密を不正取得・不正使用した者に対して、差止請求や損害賠償請求をすることができます。
そこで、「学習済みモデル」がこの「営業秘密」にあたるかどうかが問題となるわけです。
「営業秘密」にあたるといえるためには、以下の3つの条件をすべてみたす必要があります。
- 秘密管理性
- 有用性
- 非公知性
これらの条件をすべてみたす場合には、「営業秘密」として不正競争防止法による保護を受けることができます。
それぞれの条件について、簡単に見ていきましょう。
①秘密管理性
「秘密管理性」とは、営業秘密にあたる情報が秘密として管理されていることをいいます。言い換えると、営業秘密がそうでない情報と明確に分けられており、その情報が営業秘密であることがはっきりとわかるように管理されていることをいいます。
加えて、そのことを従業員などが認識できることが必要であると考えられています。
もっとも、この「秘密管理性」は、企業が厳格な秘密管理をしていればそれだけで認められるというものではありません。また、漏えいのリスクや対策費用などが一律に決まっているものでもありません。
そのため、リスクや対策費用の大小などを踏まえた適切な管理を行っていれば、「秘密管理性」はみたすものと考えられています。
この点、AIが組み込まれた「学習済みモデル」を販売するような場合には、「秘密管理性」を満たすのかが問題となります。
例えば、購入者において、AIが組み込まれたマイクロチップなどを読み取ることができれば、プログラム・データの内容を知ることができてしまいます。
このような場合には、秘密管理性は認められないということになります。
そこで、AIが組み込まれたマイクロチップなどにマル秘表示を施したり、プログラム・データの暗号化などにより秘密管理性を確保することが考えられます。
※なお、秘密管理性をみたすために必要とされる秘密管理措置の程度について、詳しく知りたい方は、経済産業省が出している「営業秘密管理指針」をご参照ください。
②有用性
「有用性」とは、その情報に広く商業的価値が認められることをいいます。これは、実際に使われている情報だけでなく、失敗に終わった研究・開発に関する情報であっても認められるとされています。
基本的に、①秘密管理性と③非公知性がみたされている情報は、有用性も認められると考えられているため、実務ではあまり問題となりません。当然、学習済みモデルについても、「有用性」は認められます。
③非公知性
「非公知性」とは、公に知られていないことをいい、営業秘密が一般的に知られておらず、または、簡単に知ることができない状態であることを意味します。
具体的には、営業秘密にあたる情報を手に入れるためには、その保有者から手に入れる以外に方法がないような場合をいいます。
以上のように見てくると、営業秘密にあたるかどうかの判断で特に重要となるのが、「①秘密管理性」の判断です。ここでは、AIが組み込まれたマイクロチップにマル秘表示を施したり、プログラム・データを暗号化するなどして、いかにして秘密管理性を確保するか
という点がポイントとなります。
7 小括
AIの学習済みモデルが著作権法によって保護されるためには、さまざまな条件をクリアしなければならないため、その判断も簡単ではなくケースバイケースとされています。
「学習済みモデル」は、著作権法のほかにも「契約」や「不正競争防止法」を根拠として保護を受けられるかどうかが問題になります。
著作権法を始めとしたこれらの保護方法を、十分に理解したうえで、自社の「学習済みモデル」がどの保護方法に整合的かをしっかりと見極めることが重要です。
8 まとめ
これまでの解説をまとめると、以下のようになります。
- プログラムであっても、創作性(オリジナリティ)が認められれば、「プログラム著作物」として著作権法により保護を受けられる可能性がある
- 著作権法による保護を受けられないものとして、①プログラム言語、②プロトコール、③アルゴリズムの3つがある
- 「プログラム著作物」として著作権法で保護されるためには、①「思想・感情」といえること、②「創作性(オリジナリティ)」があること、③「表現」されていることが必要である
- プログラムが著作権法の保護対象となるかは、プログラムにおける記述の選択肢の広狭に左右される
- コンピュータ創作物に①作成の意思、②創作的寄与が認められれば、著作物性を肯定するとする文化庁の見解は、学習済みパラメータの著作物性を考えるにあたって参考になる
- 学習済みパラメータは、「プログラム」に該当する可能性はあるものの、「思想・感情」の表現や「創作性」が認められない可能性を残しており、そのような意味で著作物性があるかどうかは不透明である
- 「データベースの著作物」として保護されるためには、①情報検索ができる体系的な構成になっていること、②情報選択や体系的な構成に創作性が認められることが必要である
- 学習済みモデルの著作者を考えるにあたっては、学習済みモデルが「共同著作物」もしくは「結合著作物」にあたるかを検討する必要がある
- 学習済みモデルを保護する手段として、著作権法以外に①契約、②営業秘密に根拠を置く方法がある
- 「営業秘密」にあたるといえるためには、①秘密管理性、②有用性、③非公知性の3つの条件をみたす必要がある