米議会図書館に収蔵のツイート1700億件超、研究者らに公開へ
(CNN) 米議会図書館が2010年から収集している短文投稿サイト「ツイッター」のツイートは、これまでに1700億件を超えた。同館はこのデータを研究者らが活用できるよう、公開方法の検討を進めている。
議会図書館は10年4月、ツイッターとの合意の下で、06年のサービス開始以降に投稿されたすべての公開ツイートを収蔵すると発表。収蔵データはその後急速に膨らんだ。11年に1日当たり約1億4000万件だったツイートの数は、現在1日5億件のペースに増えている。
同図書館の広報責任者、ゲイル・オスターバーグ氏は「ソーシャルメディアは主要な通信手段、創造的な表現手段のひとつとして使われるようになり、学術図書館が従来収集してきた文書、書物を補完するもの、あるいはそれらに取って代わるものとしての役割を果たし始めた」と指摘。収蔵している全ツイートを整理し、最良の公開方法を探っているところだと述べた。
すでに世界各地の研究者から約400件のリクエストが寄せられている。研究テーマは、市民ジャーナリズムからワクチン接種率、株式市場の動向予測までと幅広い。
議会図書館が先週、政府の報告書の中で指摘したところによると、膨大なデータを研究者らに提供するための技術はデータ作成や配信の技術に比べ遅れていて、民間でも効率的な手法が確立されていない。同図書館は民間企業と協力し、まず館内で閲覧できるシステムを整備する構えだ。
議会図書館ではこれとは別に、00年から政府関連ウェブサイトのページを収集してきた。現在では何万件ものサイトに及び、データ量は300テラバイト(テラは1兆)以上となっている。これに対し、館内収蔵の書物のデータ量は合わせて10テラバイト前後と推定される。