Data-Centric Computing Lab

The Data-Centric Computing Lab has been a center of excellence for empowering data intensive computing by designing customized software and hardware stack.

Mission


増加するデータに向き合う

企業や個人が生成するデータ量は年々爆発的に増大しており、大量のデータがデータセントリックなワークロードにより処理されています。 このようなアプリケーションは、データ当たりの計算強度が小さいことや、従来の計算機の性能向上のカギとなっていたデータの再利用の機会が小さいことが特徴にあげられます。このような背景から「データの移動」に係るコストが肥大化されており、解決すべき重要な課題となっています。私たちは、メモリを中心とした新しいコンピュテーションの方式により、増大するデータ処理コストに向き合います。

データ移動と計算にかかるエネルギー比
データ移動と計算にかかるエネルギー比

記憶と計算の融合

現在のコンピュータは、多種多様な計算の要求に対応するため、高速な一次記憶と大容量の主記憶を中心としたメモリ階層を擁しています。プロセッサの高速化とマルチコア化により、メモリに対するスループット要求が大きくなり、大量のチップ上の面積がメモリに割り当てられています。こんにちのサーバシステムでは、その合計チップ面積の約9割が、受動的な動作をするメモリに占有されています。私たちが研究する「インメモリ・コンピューティング」という技術は、チップの大部分を占めている受動的なメモリを、能動的な動作をする計算資源に転換することができます。

データ処理により実現する未来

私たちは、効率的なデータ処理を通じて、機械学習やデータベースといった情報処理分野だけではなく、医療・ゲノム処理・自動運転・IoTといった分野にも技術革新をもたらすことにより、安心・安全な社会の実現に貢献します。例えば、ゲノム処理分野では、次世代シーケンサの登場以来大量の生ゲノムデータが生成されており、プロセッサの処理速度の向上率を大幅に上回っていることから、生データの解析に係る計算能力がボトルネックとなっています。さらに、ゲノムデータは究極の個人情報であることから、セキュリティーやプライバシーの担保が重要となります。私たちは、ゲノムデータの効率的な処理エンジンや、完全秘匿型の暗号化データベースの実現により、増加する情報処理要求を安全に満足させるための技術を追求します。

Projects


In-Memory Computing
In-Memory Computingは、メモリの物理特性を利用し、密結合のメモリアレイ内で直接計算を行う技術です。SRAMやDRAM、次世代の不揮発性メモリなど、様々なメモリ上でのインメモリ計算技術を応用し、「データ移動コストの最小化」と「超並列計算」の双方から、データインテンシブなアプリケーションの持続的な発展を支えます。
In-Memory Computing
Systems for Genome Sequencing
次世代シーケンサにより大量の生ゲノムデータが得られる中、その効率的な処理に焦点をあてて研究を行っています。ハイスループットシーケンサから得られるショートリードに加え、近年発展が進むNanoporeなどのロングリードシーケンサを対象に、計算強度の高いアライメントやアセンブリといった二次処理から、ベースコーラーやウイルス検出に用いられる機械学習のフレームワークまで、多面的な研究をしてます。
Systems for Genome Sequencing
Privacy Preserved Database System
最新の暗号化技術とデータベース技術を組み合わせ、センシティブなデータをクラウド上でスケーラブルに運用させ、どんなときにでも安心して使えるデータベース基盤の構築を目指し、研究を行っています。
Privacy Preserved Database System