インターネットの研究にトラフィックの実データは重要だが、研究者がこれを入手するのは容易でない。
実データのトラフィック解析によって、個人や組織のネット上での行動がある程度追跡できる可能性があり、そのリスクを負ってまでデータを研究利用に提供してくれる組織は数少ない。また、たとえある研究者がデータの提供を受けて研究成果を論文にまとめたとしても、別の研究者が同じデータを入手するのは簡単ではない。
これは大きな問題である。すべての科学技術の基盤は、客観性と再現性にあるとも言えるにもかかわらず、ネットワーク研究の分野では第三者による再現と検証が困難な状況になっているのだ。
このような状況を改善しようというコミュニティベースの試みが、"A day in the life of the Internet"プロジェクトである。(詳しくはCAIDAのDITLページ)
簡単に説明すると、(1)1年に一度、日を決めてさまざまな組織がインターネットのデータを収集する計測デーを実施し、(2)どのようなデータがどこに存在するかを目録化して、研究者が必要なデータを探せるようにする。
今年は3月18、19日にデータ収集が実施された。
昨年に続いてWIDEプロジェクトでも、トランジットリンクのパケットトレースを収集し、72時間分のデータを公開し、DatCatカタログに登録した。
昨年は目録化に時間がかかってしまったが、今年は一番最初に登録できたようだ。多くの研究の役に立つことを期待したい。
コメントする