そんな難しいソフトウェアの著作権・およびライセンス問題ですが、AI コード生成はそれをさらに難しく、あるいはややこしくする要素になるかもしれません。
さて、下記は居酒屋政談で根拠は何もありませんが、個人的には上記の記事にある Tweet の GPL に関する指摘は論理の飛躍があると見ています。
github copilot has, by their own admission, been trained on mountains of gpl code, so i’m unclear on how it’s not a form of laundering open source code into commercial works.
本当にそうなのかなと。
GCC(GNU Compiler Collection)は GPL ライセンスの OSS ですが、GPL のコンパイラを使ってコンパイルしたプログラムは GPL とは限りません。MIT ライセンスのソースコードを GPL のコンパイラでコンパイルしても、バイナリの配布は MIT ライセンスの条件で行えます。これはバイナリにすることに必然性はなく、Babel のようにソースコードをソースコードに変換するものでも同じ理屈です。
機械学習のモデルはコンパイラのようなもので、ソースコード(関数の名前や引数など)からソースコードを作るものです。なのでソースコードを生成するものがどのようなライセンスのソースコードを学習したものであっても、生成物のライセンスには関係がないのではないかと感じます。
一方で、AI がサジェストした結果がたまたま GPL ライセンスのコードと全く同一だったらどうするのかという問題は確かにあると思います。ただそれも結局は著作権が誰に帰属するのかにより問題の方向性が異なるので、AI の生成物の著作権はそもそも認められるのか、認められる場合は誰に帰属するのかが決まらない限りは議論を進めることは不可能だと思います。僕の上記の意見も含め、いま何を言っても居酒屋政談の域を出ないかなと思います。
うーん、結局元の記事と同じ結論になってしまった。法律って難しい。
免責事項
上記の意見は法律の専門性のないソフトウェアエンジニアの私見であり、筆者は何の責任もとれません。現実に著作権法や OSS ライセンス違反関連の問題に直面した場合、上記の意見は一切参考にしないで専門家へ意見を求めてください。筆者は専門家ではありません。