サイト「日本の法律」について
2014-03-08自作サイトについて
「日本の法律」というサイトは、現行の日本の法律などを提供するサイトですが、もともとサイトを作ることは目的ではなく、法律のXMLデータを作成することが目的でした。XMLデータを作る過程で、副産物としてサイトが出来ました。
そもそもXMLデータを作ろうとした理由は、法律のアプリを作ろうかなあという思いつきからでした。法律のHTMLはe-Govで提供されているので、そんなに苦労せずe-Govのデータをそのまま使うこともできるかも、と、期待していたのですが、残念ながら、e-Govで提供されているHTMLはそのままでは使いづらいものでした。
この辺のことはtwitterに書いたものを、別エントリーにまとめてみました。
そこから、色々と試行錯誤を繰り返して、ようやく”それなりに”整った形のXMLファイルを作成することが出来ましたが、残念ながら時間がかかりすぎた気がします。2013年11月7日にサイトを公開したことをtwitterに書いたので、準備期間を含めると、半年弱かかっています。半年弱かかって、ようやくGithubにXMLファイルを置き、サイトもWordPressで管理する形に落ち着きました。で、当初の目標であったアプリについては、なんかもう若干あきらめているような感じになったりもしているのですが…
さて、XMLファイルやサイトは、せっかく作ったので公開しているというのもあるのですが、こうなるといいなー、という気持ちが2つあります。1つめは、XMLファイルをGithubで管理することで、将来的には改正の履歴が追えるのではないかということです。実務家にとって、今の法律のデータだけあっても多くの場合は役に立ちません。過去にどのような改正があったのかを知る必要があるからです。法律は時代時代によって改正されます。世相が変わったり、商習慣が変わったり、もしくは条約を批准するといった外部的な要因もあったりして。ですので、XMLファイルやサイトは、実務家の役に立つことを期待して公開してはいません。けれど、長く安定的にXMLファイルの更新ができれば、それは将来的には何らかの役に立つのではないか、と期待しています。それまで、私がちゃんと管理できるか心配ですが…。Githubもずーっと先まであるとは限りませんし。
そして、2つめは、法律の文書をコーパスとして利用することで、NLPの業界に役に立てばいいなあと考えています。法律の文章は、少なくともblogやtwitterの文章に比べて、きれいな日本語で書かれていると思います。それに、論理的な文章であるはず。しかし、法律を統計的に処理してみました、という研究があまり見つかりません。私の探し方が悪いのかな…。んー、なぜだろう。法律を使うというのは簡単に思いつきそうなものなので、あまり論文がないというのは、それなりの理由がありそうですが…。けれど、チャレンジしたい人がもしいるならば、データの整理で無駄な時間が取られないよう、用意したXMLを使ってみてほしいという気持ちがあります。それなりに綺麗なXMLにしていますので、ちょっとは役に立つかも…。
多くの法律を見てきて、私自身もいろいろな発見がありました。例えば、法律自体の数はそんなに多くなくて、政令や府省令でカバーしてる部分が多いんだなー、とか、第何条の何の何、のように「条」には枝番号があるのに、項にはそれが無いこととか。法学部の方には当たり前のことかもしれませんが、私は法律をまともに勉強したことがないので、いろいろ面白かったのです。e-Govに比べて、法律データのアクセスを自分なりにしやすくしたつもりですので、法律に興味のある高校生の方が、サイトなどを通じて、もっと法律に興味が持てたりすると、それはそれで嬉しいなあとも思います。
さて、サイトにはもう少し修正や機能の追加が必要ですが、今後は安定してサイトを運営することが目標です。あまり大きな変化はないと思いますが、いつでもそこにあるという信頼が得られるようにしていきたいと思います。