米議会図書館に収蔵のツイート1700億件超、研究者らに公開へ

  • このエントリーをはてなブックマークに追加
米議会図書館の閲覧室=同館提供

米議会図書館の閲覧室=同館提供

(CNN) 米議会図書館が2010年から収集している短文投稿サイト「ツイッター」のツイートは、これまでに1700億件を超えた。同館はこのデータを研究者らが活用できるよう、公開方法の検討を進めている。

議会図書館は10年4月、ツイッターとの合意の下で、06年のサービス開始以降に投稿されたすべての公開ツイートを収蔵すると発表。収蔵データはその後急速に膨らんだ。11年に1日当たり約1億4000万件だったツイートの数は、現在1日5億件のペースに増えている。

同図書館の広報責任者、ゲイル・オスターバーグ氏は「ソーシャルメディアは主要な通信手段、創造的な表現手段のひとつとして使われるようになり、学術図書館が従来収集してきた文書、書物を補完するもの、あるいはそれらに取って代わるものとしての役割を果たし始めた」と指摘。収蔵している全ツイートを整理し、最良の公開方法を探っているところだと述べた。

すでに世界各地の研究者から約400件のリクエストが寄せられている。研究テーマは、市民ジャーナリズムからワクチン接種率、株式市場の動向予測までと幅広い。

議会図書館が先週、政府の報告書の中で指摘したところによると、膨大なデータを研究者らに提供するための技術はデータ作成や配信の技術に比べ遅れていて、民間でも効率的な手法が確立されていない。同図書館は民間企業と協力し、まず館内で閲覧できるシステムを整備する構えだ。

議会図書館ではこれとは別に、00年から政府関連ウェブサイトのページを収集してきた。現在では何万件ものサイトに及び、データ量は300テラバイト(テラは1兆)以上となっている。これに対し、館内収蔵の書物のデータ量は合わせて10テラバイト前後と推定される。

メールマガジン登録
見過ごしていた世界の動き一目でわかる

世界20億を超える人々にニュースを提供する米CNN。「CNN.co.jpメールマガジン」は、世界各地のCNN記者から届く記事を、日本語で毎日皆様にお届けします*。世界の最新情勢やトレンドを把握しておきたい人に有益なツールです。

*平日のみ、年末年始など一部期間除く。

「Tech」のニュース

Video

Photo

注目ニュース

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]