データ基盤分野

研究部門主任

北川 博之 (筑波大学計算科学研究センター 教授)

東京大学大学院理学系研究科修了後、日本電気(株)勤務を経て、1988年筑波大学着任。理学博士(東京大学)。データベース、情報統合、データマイニング、情報検索等の研究に従事。情報処理学会および電子情報通信学会フェロー、日本学術会議連携会員。

メンバー

研究分野の概要

地球規模で大量のデータが高速に飛び交う時代になり、必要なデータをどのように入手し、有効な情報として活用するかが真に重要となっています。我々は、データ工学を中心としたアプローチにより、次世代情報化社会の基盤構築を目指した各種研究開発を推進しています。

研究紹介

分野の説明

計算科学において、ビッグデータの管理や活用はきわめて重要な課題です。計算情報学研究部門データ基盤分野は、ビッグデータ利活用のためのデータ工学関連分野の研究開発を担当しています(図1)。具体的には、多様な情報源やリアルタイムデータを統合的に扱うためのデータ統合基盤技術、高性能大規模データ分析技術、大規模科学データやソーシャルメディアに埋もれた知識やパターン等を発見するためのデータマイニング・知識発見技術、インターネット環境における様々なデータや知識を統一的に扱うためのオープンデータ関連技術などの基盤技術の研究を継続して行っています。また、計算科学研究センター地球環境研究部門、素粒子物理研究部門、生命科学研究部門、国際統合睡眠医科学研究機構等と連携して、計算科学の各分野における応用的な研究を推進しています。

図1 GPUによる確率的頻出アイテム集合マイニング

研究トピックス

ビッグデータ基盤技術

3V(Volume、Variety、Velocity)に特徴付けられるビッグデータの処理・分析のための基盤技術の研究:1) データベースやWeb等に加えて、センサデータ等のストリームを連携するための基盤システムの開発、2) GPUやメニーコア等による超並列処理を活用した高性能ビッグデータ分析技術、3) ビッグデータ処理におけるプライバシーやセキュリティ、4) RDF、LOD等のオープンデータ処理基盤。

データマイニング・知識発見

多様なデータに対するデータマイニングおよび知識発見手法に関する研究:1) テキスト、画像、グラフ等に対する各種分析アルゴリズム、2) ソーシャルメディア分析およびマイニング、3) 機械学習を用いた生体データ分析。

科学データ利活用

爆発的に増加する科学データの管理や利活用を目的とした研究:1) 大規模気象データベースGPV/JMAおよびJRA-55アーカイブの運用・開発、2) 格子QCDデータグリッドJLDG/ILDGの運用・開発、3) 機械学習を用いたゲノム・生物データ利用の高度化。

現在までの成果

ビッグデータ基盤技術

異種ストリーム統合基盤システム、ストリーム・バッチ統合型ビッグデータ処理基盤、GPUを活用した超高性能データ分析手法等の研究開発が進んでいます。

データマイニング・知識発見

大規模グラフや画像に対する高速分析アルゴリズム、ソーシャルメディアの活用範囲を飛躍的に向上させる高度なメタデータ抽出アルゴリズム等の研究開発が進んでいます。

科学データ利活用

気象庁が公開している数値気象データ(GPV)をアーカイブし、研究者などに公開するためのデータベースGPU/JMAアーカイブおよびJRA-55アーカイブの開発と運用を行っています(図2)。

図2 Google Earthを利用した天気図の閲覧

GPV/JMA Archive, http://gpvjma.ccs.hpcc.jp/~gpvjma/index.html

関連リンク:北川データ工学研究室 StreamSpinner

(最終更新日:2019.12.11)