はじめに

スクレイピングで色々なデータを集めたいけど、「スクレイピングは違法だ」ということも耳にしたことがあり、実際のところはどうなんだろ?と考えている事業者もいらっしゃるのではないでしょうか?確証を得ないまま、スクレイピングを使った事業を行うのは、正直不安ですよね。

もっとも、ビジネスの世界ではリスト作成やら何やらで、スクレイピングを多用している企業も多いはずです。

そこで今回は、そもそもスクレイピングが何なのかという点を確認したうえで、スクレイピングに関する法律上の問題点について、ITに詳しい弁護士が解説します。

1 スクレイピングとは

スクレイピング

(1)スクレイピングとはなにか

WEBスクレイピング(英: Web scraping)」とは、ウェブサイトからHTMLの情報を抽出するコンピュータソフトウェア技術のことをいいます。ウェブ・クローラーあるいはウェブ・スパイダーとも呼ばれます。

スクレイピングがされる場合、取得した情報の中から使いたい情報を抽出し、自社の目的に合った使い方ができるように形を整え直します。

スクレイピングは、クローラというプログラム(ウェブ上の文書・画像などを取得・データベース化するプログラム)を使って、データを取得するため、短い時間で多くの情報を集めることができます。

近時、このような技術を取り入れる企業が増えてきましたが、具体的にどのような形で活用しているのでしょうか。

以下で見てみましょう。

(2)スクレイピングの活用事例

スクレイピングを取り入れている企業の中でも多く見られるのが、政府や他の企業が公開している情報や、ニュースなどから、自社に必要とされる情報を抽出して、自社のデータベースを作るといった活用の仕方です。

具体的には、

  1. 必要な情報に係るHTMLデータをクローラによって取得し、そのデータから必要な情報だけをスクレイピングしてサーバに保存する
  2. 保存データを解析して、自社の目的に合ったデータベースを作る
  3. 作ったデータベースを顧客に配信する

といった流れでデータベースが作られ、顧客に配信されることになります。

スクレイピングの活用

もっとも、他社情報などをスクレイピングして、その結果得た情報を使って自社のデータベースを作ることに法的な問題点はないのでしょうか。

この点について具体的に見ていくまえに、まずはスクレイピングが実際に問題となった事例を簡単にご紹介したいと思います。

(3)スクレイピングが問題となった事例

2010年3月、愛知県にある岡崎市立図書館の蔵書検索システムにアクセス障害が発生し、その利用者の一人が逮捕されました

逮捕された人物がLibrahackというサイトを開設していたことから、「Librahack事件」とも呼ばれています。

逮捕された男性の目的は、岡崎市立図書館の蔵書検索システムの使い勝手に不満であったため自分で作ったクローラによって、蔵書検索システムから図書の情報をスクレイピングすることにありました。この男性は、蔵書検索システムに執拗にリクエストを送りつけたものとして偽計業務妨害容疑で逮捕されたのです。

スクレイピングをしたことで逮捕された、という事業者から見るとすごい怖くて、ドラスティックな事件ですよね。

この事件から言えることは、スクレイピング自体には違法性がないものの、誤った使い方をしてしまうと、逮捕された男性のように容疑をかけられる可能性があるということです。

「誤った使い方」としては、

  • スクレイピングの頻度が高く、相手に対する負荷が大きすぎる
  • スクレイピングにより取得した情報を不正に使用する

といったことが挙げられます。

結局のところ、この男性は業務妨害の強い意図が認められなかったことなどを理由に、起訴猶予処分となりましたが、少なくとも、スクレイピングを問題視されて逮捕されたという事実を軽く受け止めてはいけないものと考えられます。

それでは、話を戻してスクレイピングの法律上の問題点について、次の項目で詳しく見ていきましょう。

2 スクレイピングにまつわる法律上の問題点

スクレイピングの法律規制

事業者がスクレイピングをする際には、以下の3つの法律問題をクリアする必要があります。

  1. 著作権法上の問題
  2. 利用規約との抵触
  3. サーバーへの過度なアクセス

以下で、順番に見ていきましょう。

3 スクレイピングと著作権

スクレイピングと著作権

(1)問題の所在

著作権」とは、自分の作った絵画などの「著作物」を著作者が独占的に利用できる権利のことをいいます。「著作物」とは、自分の持っている考えや感情などを表現したもので、そこに創作性(オリジナリティ)がある物をいいます。

著作物といえるためには、この創作性(オリジナリティ)が大事で、「ああああ」等の単なる文字列といったありきたりの表現物には、著作権という強い権利は認められません。

反対に、創作性が認められれば、その著作物は著作権法により保護されることになります。この場合、他人が著作権者の同意なく、著作物をコピーしたり、自社のサーバに保存するなどの行為をすると、原則として違法となってしまいます。

この点、繰り返しになりますが、スクレイピングは、他社などのウェブサイトから情報を取得することをいいます。

他方で、スクレイピングの対象となるウェブサイトを含め、取得した他社情報(コンテンツなど)に創作性(オリジナリティ)が認められれば、そのような情報は著作権法上の「著作物」にあたることになります。

そのため、スクレイピングにより情報をコピー・サーバ保存するためには、原則として、著作権者である他社の同意を得る必要があり、同意がない場合には原則として違法ということになってしまいます。

もっとも、スクレイピングで取得する情報量は膨大であるため、その一つ一つの情報に対して同意を得ていることを求めるのは、現実的ではありません。

そこで、著作権法は以下のような例外を認めています。

(2)「情報解析を目的とした記録または翻案」

コンピュータによって情報を解析することが目的である場合には、例外的に著作権者の同意を得ることなく、スクレイピングによって取得した他社情報などを記録媒体に記録したり翻案することができます。

翻案」とは、取得した情報に新たに表現を加えることをいいます。

もっとも、以下のような場合には、違法となる可能性があるので注意が必要です。

  1. 取得情報を複製した物の譲渡
  2. 目的外利用

簡単に見てみましょう。

①取得情報を複製した物の譲渡

スクレイピングによって取得した情報を他人に譲渡することは、著作権法上禁じられています。そのため、スクレイピングで他社情報を取得した事業者は、取得した情報を自社で独自に分析したうえで、再構成する必要があります。

②目的外利用

情報解析目的以外の目的で利用した場合には、著作権法に違反することになります。

そのため、スクレイピングをする際には、あくまで「情報解析」を目的としたものでなければなりません。

 

以上のように、スクレイピングをする際には、取得する情報が「著作物」にあたるかどうかをきちんと確認する必要があります。取得する情報が「著作物」にあたるのであれば、スクレイピングが違法とならないよう、以上に挙げた2点をしっかりと確認するようにしましょう。

4 スクレイピングと利用規約

スクレイピングと利用規約

アプリなりWEBサービスを利用する際に、ごちゃっとした長文が現れ、そのサイドバーをスクロールしながらチェックボックスに同意のクリックをした経験はありますね。

その長文のテキストのことを専門用語で「利用規約」といいます。

利用規約」とは、サービスを利用するにあたっての条件やルールが記載された文書であり、契約書のようなものです。

既にご存知の方が多いと思いますが、利用規約に書かれている内容に同意を与えることで、事業者とユーザーとの間に利用規約の内容で契約が成立します。

そして、利用規約の中には「スクレイピングを禁止します」「これに違反してスクレイピングをした場合には、損害を賠償してもらいます」といった記載が盛り込まれているケースが多いです。

仮に、このような利用規約を無視してユーザーがスクレイピングをしてしまった場合、ただちに違法!ということになるのでしょうか?

このような場合に、スクレイピングが「違法」といえるためには、事業者とユーザーとの間に「スクレイピングをしない」ということについての合意が成立していなければなりません。言い換えると、ユーザーが利用規約(スクレイピングを禁止する内容が含まれているもの)に同意していることが必要になります。ユーザーが利用規約に同意することにより、ユーザーは「スクレイピングをしない」義務を負うことになるからです。

もっとも、ユーザーの同意により、利用規約に法的拘束力が認められるためには、ユーザーの同意が以下のいずれもをみたしてなされていることが必要になります。

  1. 利用規約をユーザーに対して表示すること
  2. 利用規約への同意(クリック)がユーザーの正当な取引意思に基づくこと

のいずれをもみたす必要があります。

以上のことがクリアされて、利用規約への合意が問題なく成立しているにもかかわらず、スクレイピングを行ってしまうと、利用規約違反となり、民法上の債務不履行不法行為に該当する可能性があります。

その場合、事業者から損害賠償請求差止を請求される可能性があります。

反対に、会員登録を必要とせず、誰でも閲覧できる情報をスクレイピングするような場合には、その多くの場合が事業者とユーザーとの間に契約関係はないため、利用規約違反の問題は出てこないことになります。

5 スクレイピングとサーバ負荷

スクレイピングとサーバー負荷

スクレイピングはあくまで他社などが持っている情報などを利用することを目的としています。そのため、他社が作ったコンテンツなどにアクセスすることになります。ここで注意しなければならないのが、アクセスの頻度です。

Webサイトへの過度なアクセスを直接禁止する法律はありませんが、程度を超えてアクセスをしてしまうと、サーバに過度の負荷をかけることになり、場合によっては、自社のシステムだけでなく、アクセス先のシステムにも何らかの支障が生じるおそれがあります。

この場合、先でご紹介したLibrahack事件のようにスクレイピングをした者は理論的には「偽計業務妨害罪」として逮捕される可能性があります。

この点、偽計業務妨害罪が成立するかどうかは、スクレイピング行為によって相手方の「業務を妨害したか否か」が判断基準になるところ、スクレイピングによって何回アクセスしたら違法で、反対に何回までなら合法です、といった基準はありません。

ただ、Librahack事件は一つの目安になると思われます。この事件では、逮捕された者が1秒に1回の頻度で1日2000回のスクレイピングを試みた点について、サーバに負荷をかけたとまではいえないとの見方もあります。

この判断は、まだ合法とのお墨付きを与えるものではありませんが、仮にスクレイピングをするとしても「自然検索の範囲内」で対応するのがベターかもしれません。

以上から、スクレイピングにおける法律上の問題点は、それぞれにまったく違う観点から想定されるものであることがわかると思います。

スクレイピングが違法とならないためにも、これらのルールや事件を十分に理解しておくことが重要ですが、特にどういった点に注意すべきなのでしょうか。

最後に、以下で見ていきましょう。

法律の悩みを迅速に解決します。
スタートアップ、IT、先端技術の法律相談なら私たちにお任せください!
豊富な契約書雛形もご用意していますので、IT企業に関わらずお気軽にお問い合わせください。

お問い合わせはこちらから

6 スクレイピングが違法にならないためには?

スクレイピング違法

適切にスクレイピングを行うためにも、以下の点を特に注意しておく必要があります。

  1. 利用目的
  2. スクレイピングの対象
  3. アクセス制限の遵守
  4. 利用規約

順番に見ていきましょう。

(1)利用目的

どのような利用目的でスクレイピングを行うかということをきちんと詰めておく必要があります。著作権法は、あくまで「情報解析」を目的としている場合にかぎっては、著作権者の同意を受ける必要はないとしているにすぎません。利用目的が情報解析以外の目的であるにもかかわらず、著作権者の同意を得ることなく、スクレイピングを行ってしまうと著作権法違反となります。

(2)スクレイピングの対象

スクレイピングの対象には、文章や画像、そして、音声、映像などがあります。

たとえば、文章や画像を丸パクリしたり、ライセンスが付与されているかどうかが不明な音声・映像を使ってしまうと、著作権法に違反する可能性が出てきます。

そのため、文章や画像については、一部のみ、音声や映像については、オープンライセンスのものだけをスクレイピングの対象にするといった対応が重要になってきます。

(3)アクセス制限の遵守

クローラーに対するアクセス制限のためのファイルとして「robots.txt」というものがあります。スクレイピングを行う際には、このファイルにある制限内容をきちんと守るようにしましょう。制限を超えたアクセスをしてしまうと、場合によっては、偽計業務妨害罪といった刑法上の容疑をかけられる可能性があります。

(4)利用規約

同意した利用規約に「スクレイピング禁止」と謳われているにもかかわらず、スクレイピングを行ってしまうと、利用規約違反となり、場合によっては、民事上の損害賠償を請求される可能性があります。

そのため、スクレイピングしようとするサイトに利用規約が存在する場合には、この点をきちんと確認することが必要です。

ルール違反により自社が被る損失を考えれば、これらの注意点をきちんと守ることは難しいことではありません。ルールや注意点を十分に理解して、適切にスクレイピングするようにしましょう。

7 小括

まとめ

スクレイピングは、それ自体は違法とされていないものの、そこから派生する法的な問題点は存在します。問題の所在や、その注意点などをきちんと理解しておかなければ、場合によっては、刑法上の責任を問われる可能性すらあります。

そのようなことにならないためにも、関連する法律や、どのような点に注意すべきかといったことに意識をもって、スクレイピングを行うことが重要です。

8 まとめ

これまでの解説をまとめると、以下のようになります。

  • 「スクレイピング」とは、ウェブサイトからHTMLの情報を取得して、取得した情報の中から使いたい情報を抽出し、自社の目的に合った使い方ができるように形を整えなおすことをいう
  • スクレイピングについて法律上問題となるのは、①著作権法上の問題、②利用規約との抵触、③サーバーへの過度なアクセスの3つである
  • コンピュータによって情報を解析することが目的である場合には、著作権者の同意を得ることなく、スクレイピングによって取得した他社情報などを記録媒体に記録したり翻案することができる
  • 適切にスクレイピングを行うためには、①利用目的、②スクレイピングの対象、③アクセス制限の遵守、④利用規約を注意しておく必要がある