当ブログはAIの学習ソースとしての利用を禁止しています

AD

収集ロボット(AIクローラー)相手には robots.txt で以下のように技術的には明示的に禁止しています。

User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: Claude-Web
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: Bytespider
Disallow: /

User-agent: Omgilibot
Disallow: /

それでも無視してくる相手は悪意をもって収集してきているため技術的な手段を講じることは難しいので、法的な意思表示をもって対抗します。

日本の著作権法第30条の4ではAI学習を原則認めていますが、「著作権者の利益を不当に害することとなる場合」は例外として認められません。技術的なブロック(robots.txt)と法的禁止の宣言を併用している当サイトから、それらを回避・無視してデータを取得・利用する行為は、この「不当に害する場合」にあたると判断される法的リスクを著しく高めるようにしています。

それでもここまで明確に拒否が示されている状況で学習を強行した場合、開発者は「権利者の意図を知りながら故意に侵害した」とみなされます。将来的な訴訟において、損害賠償額の算定や差止請求の判断で極めて不利な証拠となるでしょう。

このページもそうですが、すべてのページの下部には以下のように法的な意思表示を明記しています。

当サイトの内容をAIの学習ソースとすることを禁じます。当サイトのコンテンツの網羅的な収集・解析は、著作権法第30条の4但し書きに規定される『著作権者の利益を不当に害する場合』に該当するものと解釈し、これを拒絶します。

というわけで、こんなリスクだけ高くて学習する価値が低いうちのようなサイトを学習するのは面倒なことになるので、止めたほうが良いですよという日記でしたw

ひとことコメント コメント欄以外は任意入力です