[Oakforest-PACS] ゲリラ豪雨予報実証実験に伴う縮退運転について

現在、Oakforest-PACSシステムについては、「ゲリラ豪雨予報」実証実験のため縮退運転をしております。ユーザーの皆様にはご協力に感謝申し上げます。

昨晩より、1,000ノード程度の計算ノードが運用に組み込めない障害が発生しておりますが、実証実験継続中のため復旧作業を見送っております。従って、約6,000ノードでの縮退運転となっております。ユーザーの皆様には、ご不便をおかけしますが、ご理解いただけますよう、よろしくお願い申し上げます。

第9回 JCAHPCセミナー(第4回OFP利活用報告会)「人類と地球を護るスーパーコンピューティング」

現在,人類と地球は新型コロナウイルス感染症 (COVID-19) という未曾有の危機に直面しています。
問題解決に向けては「防疫」,「治療」,「創薬」など広範囲にわたり様々な手法による研究開発が急務であり,スーパーコンピュータの有する高速な計算能力,データ処理能力の貢献が期待されております。 このような状況の下,HPCI(革新的ハイパフォーマンス・コンピューティング・インフラ (*1) ) においては,関係機関の協力のもと,関連する研究が必要とする計算資源を提供する臨時の課題募集 「新型コロナウイルス感染症対応HPCI臨時公募課題(*2)」 がおこなわれています。

最先端共同HPC基盤施設(JCAHPC: Joint Center for Advanced High Performance Computing)筑波大学計算科学研究センター東京大学情報基盤センターとが共同で設立した組織です。 JCAHPCでは国内最大級の計算性能を有するOakforest-PACSシステム(OFP)を設計,導入し,2016年10月より共同で運用を開始して以来,最先端の計算科学を推進し,我が国と世界の学術及び科学技術の振興に寄与してまいりました。

筑波大学・東京大学の両センターとJCAHPCは,HPCIシステム構成機関として「新型コロナウイルス感染症対応HPCI臨時公募課題」に計算資源を提供し、新型コロナウイルス感染症に関する研究を支援しています。 2020年8月20日現在,合計13課題が採択されていますが,そのうち3課題が最先端共同HPC基盤施設(JCAHPC)のOakforest-PACSを使用したものであり,2課題が筑波大学計算科学研究センターのCygnus,3課題が東大情報基盤センターのOakbridge-CX(OBCX)となっており,60%以上の課題が筑波大・東大関連のシステムを利用して実施されています。

JCAHPCでは,2017年から毎年10月に「OFP利活用報告会」として利用者,JCAHPC教員により,OFPにおける研究開発事例の紹介を実施してまいりました。 第4回目となる今回は「人類と地球を護るスーパーコンピューティング」として,「新型コロナウイルス感染症対応HPCI臨時公募課題」の事例の他,OFPによるゲリラ豪雨予測リアルタイム実証実験について紹介します。 また,「新型コロナウイルス感染症対応HPCI臨時公募課題」についてはOFPだけでなく,Cygnus(筑波大,1件),OBCX(東大,2件)を利用した課題についても紹介いたします。

(*1)HPCI(革新的ハイパフォーマンス・コンピューティング・インフラ)
文部科学省が整備した日本が誇る強力な研究基盤。国立大学・国立研究開発法人に設置されているスーパーコンピュータ等を高速ネットワークで結び、多様なユーザーニーズに応える革新的な共用計算環境を提供している。
(*2)HPCIシステム構成機関の協力により実現した文部科学省主導プロジェクト。新型コロナウイルス感染症対策の研究のために 学術界、産業界を問わず、新型コロナウイルス感染症対策を行っている研究者に合計114PFLOPSの性能を有する多様なスーパーコンピュータ資源を無償で提供する臨時の公募。詳細は https://www.hpci-office.jp/


本利用活用報告会はオンラインにて開催予定です。

第9回JCAHPCセミナー(第4回OFP利活用報告会)
「人類と地球を護るスーパーコンピューティング」

日時:2020 年 10 月 15 日(木)(13 : 00 ~ 17 : 10)
主催:最先端共同HPC基盤施設(JCAHPC)
共催:東京大学情報基盤センター,筑波大学計算科学研究センター
   HPCIコンソーシアム
参加費:無料,「事前参加登録」をお願いいたします。

参加申込

申込フォーム

※必ず事前登録をお願いいたします(セミナーの前日まで受け付けます)

プログラム

時 間 講演者/表題 利 用
システム*
13:00 – 13:15 中島研吾(東京大学 JCAHPC)
Opening
13:15 – 13:45 三好建正(理化学研究所)
ゲリラ豪雨予測のリアルタイム実証実験
OFP
13:45 – 14:15 Marco Edoardo Rosti(OIST)
Spreading of polydisperse droplets
in a turbulent puff of saturated exhaled air
OBCX
14:15 – 14:45 岡田純一(UT Heart 研究所)
COVID-19治療の候補薬:
chloroquine、hydroxychloroquine、azithromycinの
催不整脈リスクの評価ならびにその低減策に関する研究
OFP
14:45 – 15:00 休憩
15:00 – 15:30 杉田有治(理化学研究所)
新型コロナウイルス表面のタンパク質動的構造予測
OFP
15:30 – 16:00 望月祐志(立教大学)
新型コロナウイルスの主要プロテアーゼに関する
フラグメント分子軌道計算
OFP
16:00 – 16:30 重田育照(筑波大学)
Covid-19 関連タンパクに対する統合的インシリコリポジショニング
Cygnus
16:30 – 17:00 星野忠次(千葉大学)
計算機解析によるSARS-CoV-2増殖阻害化合物の探索
OBCX
17:00 – 17:10 朴泰祐(筑波大学 JCAHPC)
Closing
* OFP:Oakforest-PACS、OBCX:Oakbridge-CX

本セミナーの問い合わせ先

〒113-8658 東京都文京区弥生2-11-16
東京大学 情報基盤センター

中島研吾(幹事)
E-mail:nakajima@cc.u-tokyo.ac.jp
(”@”を半角にしてからお送りください。)

なぜ、超伝導電流は電気抵抗なしで消えるのか? 〜磁場中での超伝導-常伝導相転移を説明する新理論〜

概要

国立大学法人筑波大学計算科学研究センター 小泉裕康准教授は、現在、広く適用されている超伝導理論では説明ができなかった、超伝導体が磁場中で超伝導状態から通常の金属状態(常伝道状態)に相転移する際、超伝導電流がジュール熱を発生せずに消失するという現象の、理論的解明に成功しました。

本研究が提唱する新理論では、「超伝導電流はベリー接続」によって生じる集団モードが作るループ電流の集まりである」と考えるべきであることが示されました。また、ベリー接続の生成にはラシュバ型スピン軌道相互作用が重要である可能性を明らかにしました。

現在の超伝導の標準理論は、超伝導電流の説明の点で問題があることが度々指摘されてきました。今回の成果は、この問題点を解消するために、標準理論をどのように変更していくべきかについての一つの指針を提示したことになります。標準理論が変更されることにより、長い間、メカニズムが不明のままになっている、銅酸化物高温超伝導の機構解明が達成される可能性もあります。さらに、超伝導体を量子ビットとして使うエラー訂正機能を備えた量子コンピュータの実現に関しても、重要な貢献になり得ると考えられます。

プレスリリース全文

研究トピックス「現実世界の課題をコンピュータビジョンで解決!」公開

計算科学研究センター(CCS)に所属する教員・研究員の研究をわかりやす句紹介する「研究者に聞く− 研究トピックス」に「Vol.2 現実世界の課題をコンピュータビジョンで解決!」を公開しました。

計算情報学研究部門 計算メディア分野 の北原教授の研究を紹介しています。

「研究者に聞く− 研究トピックス」

「Vol.2 現実世界の課題をコンピュータビジョンで解決!」

30秒ごとに更新するゲリラ豪雨予報 -首都圏でのリアルタイム実証実験を開始-

理化学研究所(理研) 計算科学研究センターデータ同化研究チームの三好建正チームリーダー、情報通信研究機構 電磁波研究所リモートセンシング研究室の佐藤晋介研究マネージャー、大阪大学 大学院工学研究科の牛尾知雄教授、株式会社エムティーアイ ライフ事業部気象サービス部の小池佳奈部長、筑波大学 計算科学研究センターの朴泰祐教授、東京大学 情報基盤センターの中島研吾教授らの共同研究グループは、2020年8月25日から9月5日まで、首都圏において30秒ごとに更新する30分後までの超高速降水予報のリアルタイム実証実験を行います。

本研究成果は、近年増大する突発的なゲリラ豪雨[1]などの降水リスクに対して、コンピュータ上の仮想世界と現実世界をリンクさせることで、超スマート社会Society 5.0[2]の実現に貢献すると期待できます。

共同研究グループは、2016年にスーパーコンピュータ「京」[3]とフェーズドアレイ気象レーダ(PAWR)[4]を生かした「ゲリラ豪雨予測手法」を開発しました注1)。今回、この手法を高度化し、さいたま市に設置されている情報通信研究機構が運用する最新鋭のマルチパラメータ・フェーズドアレイ気象レーダ(MP-PAWR)[5] による30秒ごとの雨雲の詳細な観測データと、筑波大学と東京大学が共同で運営する最先端共同HPC基盤施設(JCAHPC)のスーパーコンピュータOakforest-PACS[6]を用いて、リアルタイムで30秒ごとに新しいデータを取り込んで更新し、30分後まで予測する超高速降水予報システムを開発しました。この予測データを、理研の天気予報研究のウェブページでは30秒ごとに分割して連続的に表示します。これまでの天気予報と比べて桁違いに速い速度で更新することにより、わずか数分の間に急激に発達するゲリラ豪雨を予測できます。このリアルタイム予報は世界初かつ唯一の取り組みで、研究開発に着手した2013年10月から継続してきたさまざまな成果の集大成です。

実証実験で得る予報データは、気象業務法に基づく予報業務許可のもと、理研の天気予報研究のウェブページ(https://weather.riken.jp/)および株式会社エムティーアイのスマートフォンアプリ「3D雨雲ウォッチ」(https://pawr.life-ranger.jp/)で8月25日午後2時から公開します。

ただし、この予報は試験的に行うものであり、実用に供する気象予報に十分な精度や安定した配信環境が保証されたものではなく、利用者の安全や利益に関わる意思決定のための利用には適したものではありません。

 

プレスリリース全文

現実世界の課題をコンピュータビジョンで解決!

北原 格 教授

計算情報学研究部門 計算メディア分野

北原教授は、我々人間と同等の視覚機能をコンピュータで実現することを目的としたコンピュータビジョン(Computer Vison)注1)の研究者です。研究成果を使って、内視鏡で撮影した医療画像をもとに手術のナビゲーションを行なったり、観光客の記念撮影写真から世界遺産などの保全状態を把握したりと、様々な場面で人間活動をサポートする応用研究も進めています。

(2020.8.21 公開)

 

知識・経験に基づく画像判定で意味のある情報を引き出す

北原教授は、コンピュータビジョンを用いて現実世界の様々な課題に挑戦しています。ここでは、災害現場での活用例について紹介します。

図1 空撮写真から復元した3次元地図に災害状況をラベル付けしたイメージ

近年の災害現場では、被災状況調査に加え、その場にいる人がスマホで撮影した映像やドローンによる空撮映像など、現場の状況を伝える画像をたくさん得ることが可能となってきました。しかし、何万枚という写真を並べられても、一度に見きれるものではありません。一方、災害現場が3次元的に再現され、被災箇所やその程度がラベルされていたら、救助などにすぐ役立てることができます(図1)。 

たくさんの現場写真からこのような被災地マップを作るには、難しいポイントが二つあります。

一つは、カメラが動きまわりながら、変動する被写体を撮影している点です。固定カメラで静止した被写体を撮る場合とは違い、カメラも被写体も動く場合、画像上のある点が他のカメラから撮影したどの点に対応するのかを解析的に調べて統合する方法では、3次元形状を正確に構築することができません。

もう一つは、画像を観察する人にとって意味のある情報を推定して提示することが求められる点です。先程の例なら、被災地マップに「全壊」「無傷」のようなラベルをつける必要があります。

この二つのポイントを解決するために、北原教授は人工知能処理の一つである深層学習(Deep Learning)注2)によって画像から必要な情報を効率的に獲得する研究を進めています。人間が一枚の写真から奥行きや位置関係、状況などを把握できるように、コンピュータにも知識・経験に基づいて画像を判定してもらおうというものです。

人間の知識も、スパコンも活用

コンピュータによる判定を実現するためには、正解・不正解が分かっているデータ(教師データ)を用いて“学習”する必要があります。北原教授の参加する研究プロジェクト『CRESTサイボーグクラウド』では、教師データを作るためにクラウドソーシング 注3)でたくさんの人に画像判定をしてもらう試みを導入しました。これにより、効率的に多くの「人間の知識・経験に基づく教師データ」を集めることが可能になりました(図2)。

図2スパコンによる人工知能処理(倒壊判定)のイメージ:人間が判定したデータを教師データとして識別パターンを生成し、新たに被災地で収集された画像の状態を判定する。

こうして集めた教師データをもとに、無数の場合わけのパターンに対する適切な判定を学習し、「このデータの場合はこの判定」という識別パターンのセットを作ります。この識別パターンを参照することで、入力データ(画像)に含まれる色や明るさの情報を変換した数字(数値情報)から3次元形状復元や状況判定を高速かつ正確に計算できるようになります。

識別パターンの作成には膨大な計算が必要なため、計算科学研究センターのスーパーコンピュータ(以下、スパコン)Cygnusも活用しています。このCygnusは、メモリ容量が大きく並列処理が得意なため、画像処理の研究にも高いパフォーマンスを発揮するスパコンです。

画像処理に強いCygnusが加わったことで、より多様で大量のデータを高速かつ高精度に検証することが可能になりました。


【用語】
1) コンピュータビジョン(Computer Vision):人間が有する高度な視覚機能をコンピュータ上で実現することを目的とした研究分野。 “ロボットの目”の実現を目指していることからロボットビジョンやマシンビジョンと呼ばれることもある。
2) 深層学習(Deep Learning):生物の神経回路を模した人工ニューラルネットワークを多層(入力層+2つ以上の中間層+出力層)に結合し、学習能力を高めた機械学習の手法の一つ。
3) クラウドソーシング: crowd(群集)+ sourcing(業務委託)= crowdsourcing という造語。インターネットを通じて不特定多数のユーザが手分けして作業した成果を持ち寄ることで、大きなプロジェクトを進めることが可能。

 

さらに詳しく知りたい人へ

  • 北原研究室 研究紹介ページ (2021.12.15 リンク更新)
    (防災研究のほか、手術ナビゲーション技術、自由視点映像による児童発達支援などの研究紹介動画を見ることができます)

 

第12回「学際計算科学による新たな知の発見・統合・創出」シンポジウム(オンライン開催・要事前登録)

CCS International Symposium 2020

開催案内

主催 筑波大学 計算科学研究センター
日時 2020年10月6日(火) 9:20~18:00
会場 Zoom (オンライン開催のみ)
参加費 シンポジウム参加無料
参加登録 接続のためのZoomのリンク(会議パスワード)をお送りしますので、必ず事前登録をお願いいたします(2020年9月30日締切)。
事前登録
問い合わせ シンポジウム問い合わせ窓口
ccssympo[at]ccs.tsukuba.ac.jp
スパム防止のためアットマークを[at]と表示しています。
送信の際は[at]はアットマークに置き換えていただくようお願いいたします。

* 本シンポジウムは全て英語で行います。

プログラムおよび詳細については、こちらの英語ページをご覧ください。
https://www.ccs.tsukuba.ac.jp/sympo20201006en/

 

 

12th symposium on Discovery, Fusion, Creation of New Knowledge by Multidisciplinary Computational Sciences

CCS International Symposium 2020

Date and Venue /Zoom / ProgramRegistration  


Today, computational science is an indispensable research methodology in the basic and applied sciences and contributes significantly to the progress of a wide variety of scientific research fields. For multidisciplinary computational science based on the fusion of computational and computer sciences, frequent/regular opportunities of communication and collaboration are essential. Center for Computational Sciences (CCS) at the University of Tsukuba aims at improving such collaborations between different research fields. In this symposium, plenary speakers in various fields of computational sciences will give us talks on research frontiers, comprehensible to researchers and graduate students in other fields. In 2010, the CCS was recognized under the Advanced Interdisciplinary Computational Science Collaboration Initiative (AISCI) by MEXT, and has since provided the use of its computational facilities to researchers nationwide as part of the Multidisciplinary Cooperative Research Program (MCRP). Since the last year, this symposium has been open to worldwide. This year, the symposium will be held online.

 

 

 

 

 

PDF

 

 

Date and Venue

Date:Oct. 6, 2020 [Tue] 
Venue:Online

For the plenary session (9:20-16:10), participate in this Zoom meeting:

Zoom (Plenary session)  

For parallel sessions (16:20-18:00), click on “Zoom” in each session on the program below.

(*The password of the Zoom meeting will be sent to the registered email address after registration.)

Program 

Oct. 6 (Tue) 9:20 – 18:00 (JST)
 Chair: Kazuhiro Yabana
 9:20-9:30 Opening Address
Hideo Kigoshi (University of Tsukuba, Vice President)
Taisuke Boku (University of Tsukuba, Director of CCS)
9:30-10:05 GeoGate: Correlating Geo-Temporal Datasets Using an Augmented Reality Space-Time Cube and Tangible Interactions (30+5 min)
Bruce H. Thomas (University of South Australia)
10:05-10:40 Deep Eukaryote Relationships Inferred Through Phylogenomics Aided by PhyloFisher (30+5 min)
Matthew W. Brown (Mississippi State University)
  Break (10min)
 Chair: Kazumasa Horie
10:50-11:25 AI-powered Geospatial Data Platform (30+5 min)
Kyoung-Sook Kim (AIST Artificial Intelligence Research Center)
11:25-12:00 Computing Atomic Nuclei (30+5 min)
Nicolas Schunck (Lawrence Livermore National Laboratory)
12:00-12:35 The Supercomputer “Fugaku” and A64FX Manycore Processor (30+5 min)
Mitsuhisa Sato (RIKEN Center for Computational Science)
Lunch(12:35-13:40)
 Chair: Yoshinari Kameda
13:40-14:15 Performance Evaluation of Electron Dynamics Simulation in Supercomputer Fugaku (30+5 min)
Kazuhiro Yabana (University of Tsukuba) 
14:15-14:50 Supercomputing the phase diagram of strongly interacting matter (30+5 min)
Frithjof Karsch (Bielefeld University)
  Break (10min)
 Chair: Hiroyuki Kusaka
15:00-15:35 Solving Kinematics of Cosmological Neutrinos in the 6D Phase Space on FUGAKU (30+5 min)
Kohji Yoshikawa (University of Tsukuba)
15:35-16:10 Lagrangian Methods in Mountain Meteorology: Challenges and Opportunities (30+5 min)
Michael Sprenger (ETH Zurich) 
  Break (10min)
Progress reports of the MCRP-2019 
16:20-18:00 Parallel sessions

  Session1 (Particle physics) Convenor: Hiroshi Ohno 
    ・ Program (PDF)  ・ Zoom


  Session2 (Astrophysics) Convenor: Kohji Yoshikawa
    ・ Program (PDF) ・ Zoom


  Session3 (Nuclear physics) Convenor: Nobuo Hinohara
    ・ Program  (PDF) ・ Zoom


  Session4 (Material science) Convenor: Atsushi Yamada
    ・ Program  (PDF) ・ Zoom


  Session5 (Life science, Chemistry) Convenor: Mitsuo Shoji
    ・ Program  (PDF) ・ Zoom


  Session6 (Biology, Global environment, Numerical analysis, Computational informatics) Convenor: Yuji Inagaki
    ・ Program  (PDF) ・ Zoom


  Session7 (HPC systems) Convenor: Daisuke Takahashi
    ・ Program  (PDF) ・ Zoom

 

Registration

Participants should finish the registration by September 30, 2020. Presenters of the progress report of the MCRP-2019 projects must do it by September 13, 2020. The registration is free.  

[Registration here]

 

Organizing Committee

Nobuo Hinohara
Kazumasa Horie
Yuji Inagaki
Yoshinari Kameda
Hiroyuki Kusaka
Takashi Nakatsukasa
Hiroshi Ohno
Mitsuo Shoji
Daisuke Takahashi
Atsushi Yamada
Akio Yamagami
Kohji Yoshikawa

Contact: ccssympo[at]ccs.tsukuba.ac.jp

GPU オンラインキャンプ開催(8.7 追記あり)

開催日時    :2020/09/09(水) ~ 2020/09/11(金) 10:00 – 17:00 

申込期限    :2020/08/28(金)17:00 申込期限延長中です(申し込み方法はページ下部をご確認ください)

主催:筑波大学計算科学研究センター、エヌビディア合同会社

概要

筑波大学計算科学研究センターでは、GPUコンピューティングに関するワークショップイベント「GPUオンラインキャンプ」を開催します。GPUの初心者の方からある程度経験のある方まで、どなたでも自由に参加頂けます。参加費は無料です。

特に、筑波大学計算科学研究センターが運用するGPUやFPGAを搭載するスーパーコンピュータであるCygnusのユーザの方、これから同システムを使ってみようという方の積極的な参加を歓迎します。 

GPUオンラインキャンプは科学者や研究者、またコード開発者等の参加者が3日間集中して、メンターや他の参加者と一緒にGPU コンピューティング関連の課題を解決するためのイベントです。本来であれば計算科学研究センターの一室に集合して密な連携や議論を行いたいところですが、現在の情勢を踏まえてSlackやzoom等を利用するオンラインでの開催となります。遠方にお住まいの方も、この機会をぜひご活用ください。

本イベントでは1人の参加者はNVIDIA V100 32GB GPUを1基、占有して利用することができます。GPU利用については、科学技術計算やディープラーニングなどに限っていません。幅広い分野からの参加を歓迎します。CPUコードのGPU化、GPUコードの高速化、V100 GPUへの最適化など、各参加者は本イベントで取り組むGPUコンピューティング関連の課題を設定していただきます。

 

メンター紹介(予定)

成瀬 彰:エヌビディア合同会社 シニアデベロッパーテクノロジーエンジニア

山崎和博:エヌビディア合同会社 ディープラーニングソリューションアーキテクト

丹 愛彦:エヌビディア合同会社 HPCソリューションアーキテクト

大串正矢:エヌビディア合同会社 シニアソリューションアーキテクト

大友広幸:東京工業大学 横田理央研究室 博士課程1年

額田 彰:筑波大学 計算科学研究センター 教授

小林諒平:筑波大学 計算科学研究センター 助教

 

対象者

募集人数:最大16名を予定

センターのスーパーコンピュータの利用を検討しているアカデミア(大学教員、学生、研究機関研究員など)の他、企業に所属し、営利目的ではなく並列プログラミングの技術向上等を目的とした研究者、技術者の方も参加可能です。実施内容は、学術研究、教育および社会貢献に関連するものに限ります。原則、3日間ご出席ください。一時的な離席等は自由です。

 

参加資格 

  • 国公私立大学・高専の教員・学生・研究生、研究機関研究員、または企業に所属する研究者・技術者等であること。アカウント所有の有無は問いません。
  • Cygnusに有効なアカウントを持たない場合は、参加確定後に迅速に手続きを進めていただけること。申請書をダウンロードして印刷し、自署したものをスキャンしたPDFファイルを所属組織の発行する身分証のコピーまたは証明書とともにメールで送る等、最大で4回センター担当者とのやりとりが必要になります。なお、有効な筑波大学統一認証IDを持っている、過去に持っていたことがある、Cygnusのアカウントを持っていたことがある、本センターの旧システムを利用したことがある、等に該当する場合にはコメント欄にその旨を記載してください。
  • 外国人または海外在住者の方は外為法関係の審査が間に合わないためご参加いただけません。ただし現在Cygnusに有効なアカウントを持っている方は参加できます。(2020.8.7 追記)
  • 課題に取り組む上で必要なコードおよびデータセット等をセンターのストレージに転送できる方。本センターでは練習用のコードなどは準備しませんので、参加者ご自身でコードやデータセットを持ち込めない場合は、参加することができません。
  • SSH (Secure Shell) を介したコマンドライン操作によるLinux上での作業に支障のないこと。Linuxのコマンドライン操作に関する基礎知識が必要です。また、センターのスーパーコンピューターにインストールされているエディタ(emacs, vim)のいずれかを用いて、ファイルの編集を行う必要があります。上記のいずれかのエディタの操作にも慣れていない場合には,いずれかのエディタの予習を各自で行なっておいてください。
  • 開催期間中にSSHやSlack、zoomが安定して利用可能なネットワーク環境があること。不明な場合は所属機関等のネットワーク管理者にお問い合わせください。(2020.7.30 追記)



プログラム(予定)

一日目 10:00-10:30 事務連絡、自己紹介、目標設定

    10:30-11:00 Cygnus利用案内

    11:00-13:00 実践(適宜自由に休憩)

    13:00-13:30 お役立ち情報

    13:30-16:50 実践

    16:50-17:00 事務連絡

    17:00     終了

 

二日目 10:00-16:50 実践(適宜自由に休憩)

    16:50-17:00 事務連絡

    17:00    終了

 

三日目 10:00-16:50 実践(適宜自由に休憩)

    16:50-17:00 事務連絡

    17:00-   アンケート回答、終了



参加申込

開催日時    :2020/09/09(水) ~ 2020/09/11(金) 10:00 – 17:00 

申込期限    :2020/08/28(金)17:00  申込期限を延長しています。(定員になり次第〆切予定)

申込方法    :下記ページの申し込みフォームより、お申込みください。

      https://forms.gle/RnJWxq8ACTSH7F7Z7

※選定結果につきましては、メールで通知させていただきます。

[webリリース]サルコシン酸化酵素の反応機構を理論解明

筑波大学計算科学研究センターの庄司光男助教と重田育照教授は、HPCシステムズ株式会社の阿部幸浩博士、ストラスブール大 Mauro Boero教授、摂南大学の西矢芳昭教授との共同研究により、サルコシン酸化酵素の反応機構を理論解明しました。発表論文は、英国王立化学会誌「Physical Chemistry Chemical Physics」に掲載され、研究イラストは裏表紙(outside back cover)に採用されました。

論文の概要:
サルコシン酸化酵素は肝臓機能(クレアチニン測定)の診断薬として臨床検査で広く利用されています。本研究ではサルコシン酸化酵素とN-cyclopropylglycine(CPG)基質との反応過程を量子古典混合計算法(QM/MM)で理論解明することに成功しました。その結果、反応機構は通説となっていた機構(一電子移動機構)ではなく、異なる機構(Polor機構)であることを解き明かしました。さらに反応中間体を明確に帰属することができました。生体内の複雑な酵素反応過程でもスーパーコンピュータを活用することで、正確に解明することが可能になっています。

掲載論文:
Mitsuo Shoji*, Yukihiro Abe*, Mauro Boero, Yasuteru Shigeta and Yoshiaki Nishiya, ”Reaction Mechanism of Monomeric Sarcosine Oxidase with N-Cyclopropylglycine”, Physical Chemistry Chemical Physics, 2020,22, 16552-16561,  DOI: 10.1039/D0CP01679A.

掲載誌はこちらからどうぞ

光と固体の量子力学的な相互作用による新たな光の発生機構を解明 ―高次高調波光の発生機構の解明に向けた新たな知見―

概要

京都大学化学研究所の佐成晏之 理学研究科博士課程学生、廣理英基 准教授、金光義彦 教授、東京大学大学院工学系研究科の篠原康 特任助教、石川顕一 教授、同大学附属物性研究所の板谷治郎 准教授、国立研究開発法人量子科学技術研究開発機構の乙部智仁 上席研究員、筑波大学計算科学研究センターの佐藤駿丞 助教(マックスプランク研究所 客員研究員兼任)らの研究グループは、ワイドギャップペロブスカイト半導体であるCH3NH3PbCl3単結晶に高い電場強度の中赤外領域のレーザーパルスを照射すると、可視から紫外にわたる幅広い波長範囲の光が発生することを発見し、その発生機構を解明しました。この現象は高次高調波発生1)と呼ばれ、従来、原子や分子などの気体において広く調べられ、X線光源やアト秒の光パルスを発生する技術へと応用されています。一方で、固体は気体に比べて高い電子密度を持つために、高効率でコンパクトな光源となり、デバイス開発への応用が期待されています。しかし、多くの原子やイオンが集まった固体においては、光が作用する電子系のエネルギー状態は極めて複雑となり、高次高調波の発生の理解はほとんど進んでいませんでした。本研究では、複雑な電子状態を計算に取り込むことにより、発生効率の励起光強度依存性や結晶角度依存性などの実験結果を再現することに成功しました。これらの精密な実験と理論計算との比較によって、従来発生機構として考えられてきた強光電場で駆動される電子の運動だけでなく、価電子帯から伝導帯に励起されるキャリアの応答の非線形性が重要な役割を果たすことをはじめて明らかにしました。

本研究成果は、2020年7月30日に米国物理学会が発行する学術誌「Physical Review B:Condensed Matter and Materials Physics (Rapid Communication)」に掲載されます。

図:従来と今回解明した高次高調波発生機構の概念図。従来のモデルで見落とされていた価電子帯から伝導帯への電子の励起密度の非線形な変化の重要性を今回明らかにしました。右図において、励起キャリアの明るさの強弱は、光電場の振動とともに発生したり消滅したりするキャリアの仮想励起を示しています。

 

プレスリリース全文

[Oakforest-PACS] 7/17~7/21 利用可能な総ノード数が減少していたことのご報告とお詫び(解決済み)

7/17 22:00から7/21 18:00まで、システム障害のため 
キュー(ジョブクラス)regular-flatで利用可能な総ノード数が3000減少して 
約1300ノードとなっておりました。 
7/21 18:00に復旧いたしました。 
 
利用者の皆様には大変ご迷惑をおかけいたしましたことをお詫び申し上げます。

関連サイト:東京大学情報基盤センター スーパーコンピューティング部門

スーパーコンピュータ Oakforest-PACS のストレージが IO-500のバンド幅部門にて再び世界一位に(2020年7月23日)

最先端共同HPC基盤施設(筑波大学計算科学研究センター・東京大学情報基盤センター)が運用するスーパーコンピュータ Oakforest-PACS が、スーパーコンピュータのストレージ性能の世界ランキングリストIO-500のバンド幅部門において再び第一位を獲得しました。
IO-500 は、2017 年11月に初めて公表されたストレージ性能の世界ランキングリストです。Oakforest-PACS のストレージシステムは2017年11月、2018年6月のランキングで総合第一位、2019年6月のランキングでバンド幅部門第一位を獲得してきました。2019年11月のランキングからルールが変更となり新しいランキングとなりましたが、2020年7月のランキングにおいてバンド幅部門で世界第一位を獲得しました。

ストレージ性能は大規模数値シミュレーションだけではなく、ビッグデータ・AI 処理に極めて重要で、ストレージ性能の向上は、スーパーコンピュータシステムの計算処理を向上させる上で大きな影響を及ぼす要素です。IO-500 では、大規模ファイルの書込・読込性能と小規模ファイルの書込・読込・リスティング性能を測定するベンチマークプログラムを用いてスコアが決定されます。

参考:IO-500 2020-07 Full list

【受賞】塩川准教授が日本データベース学会上林奨励賞受賞

計算科学研究センターの塩川 浩昭准教授が日本データベース学会2019年度上林奨励賞を受賞いたしました(受賞日:2020年6月26日)。

上林奨励賞はデータベース、メディアコンテンツ、情報マネージメント、ソーシャルコンピューティングに関する研究や技術に対して国際的に優れた貢献を行った若手研究者に対して贈られるものです。

学会HPはこちら

 

 

Cygnusによる新型コロナウイルス感染症(COVID-19)研究スタート

生命科学研究部門の重田教授らによる研究課題「Covid-19 関連タンパクに対する統合的インシリコリポジショニング」が、新型コロナウイルス感染症対応HPCI臨時課題募集に採択されました。
 
この研究はCygnusを用いてメインプロテアーゼに対する阻害剤候補のスクリーニング計算を行い、Covid19に対する創薬支援を行うことを目的としています。
 
 
 
 
 

Assistant professor with a fixed-term appointment

Center for Computational Sciences (CCS), University of Tsukuba, invites applications for full-time (non-tenured) faculty positions as described below. We would like to inform all institutes concerning about this field, and ask for your cooperation in recommending a suitable candidate for the position. Thank you for your support.

Position  Title: Assistant professor with a fixed term appointment

Affiliation: Center for Computational Sciences, University of Tsukuba

Field of Expertise: Computational Materials Science including condensed matter physics, quantum chemistry, and molecular simulations.

Research: In our center, we seek a (non-tenured) assistant professor to develop the materials informatics (MI) method using classical molecular dynamics (MD) simulations, first-principles calculations, and machine learning (ML), and apply it to the semiconductor systems. The successful candidate will be a member of the Divisions of Life Science and Quantum Condensed Matter Physics. He/She will collaborate with researchers in the semiconductor engineering and informatics fields in Tsukuba Research Energy Center for Material Sciences (TREMS) and Center for Artificial Intelligence Research (C-AIR) as well as companies.

Starting date: October 1, 2020 or later, as soon as possible

Period: Until March 31st, 2021 (possible to renew until March 31st, 2023, upon evaluation of the progress)

Requirement: Applicants must have a doctoral degree.

Compensation

Salary: Annual salary system (The annual salary will be determined based on the regulations of the University, taking into account the career of the employer.)

Working hours: Discretionary labor system

Holidays: Saturday, Sundays, national holidays, New Year’s holidays (Dec.29  Jan. 3), and holidays determined by the University.

 

Submissions: 1) Resume/CV (with photograph)

2) List of research activities including peer-reviewed papers, peer-reviewed proceedings, oral presentations at international conferences, competitive research funds (representative), awards, and so on.

 3) Up to five reprints of major papers (at least four of which are within the last five years)

4) Summary of research to date (within 1 sheet of A4 paper)

5) Research and educational aspirations after assuming the position (about 1 sheet of A4 paper)

 6) A list of two professional references with complete contact information.

Submission deadline: Friday, July 3, 2020 (JST).

Please write “Application for Assistant Professor Position in Materials Informatics” on the subject and send a zip file with a password for the documents (1-6) in the pdf format via e-mail to apply_2020_L01 [at]ccs.tsukuba.ac.jp ([at] should be replaced by @). The password is separately sent to shigeta[at]ccs.tsukuba.ac.jp ([at] should be replaced by @ as well).

Contact address: Yasuteru Shigeta

(Tel: +81-29-853-6496, Email: shigeta[at]ccs.tsukuba.ac.jp)

 

Miscellaneous: The Center for Computational Sciences has been approved as a Joint Collaborative Research Center by the Ministry of Education, Culture, Sports, Science and Technology. We promote interdisciplinary computational sciences, including joint use of our supercomputer systems. The University of Tsukuba conducts its personnel selection process in compliance with the Equal Employment Opportunity Act.

[生命科学研究部門][量子物性研究部門]助教公募(任期付)(締切:2020年7月3日)

公募人員:助教(任期付)1名


所属組織:筑波大学計算科学研究センター

専門分野:当センターでは, 機械学習・深層学習, 分子シミュレーションや第一原理計算を用いてマテリアルズインフォマティクス技術の開発, および応用研究を実施する, 助教(任期付)を募集します。特に, 着任後は「生命科学研究部門」および「量子物性研究部門」のメンバー, および企業と共同し, 意欲的に半導体工学分野と連携して頂ける方を希望します。

着任時期:2020年10月1日以降, できるだけ早い時期

任期  :2021年3月31日まで(更新可・最長2023年3月31日まで)

応募資格:博士の学位を有する者

提出書類:1)履歴書(写真貼付)

 2)業績リスト(査読付き学術論文、招待講演、外部資金の獲得状況)

 3)主要論文別刷5編(うち4編以上は最近5年以内のもの)

 4)これまでの研究の概要(A4用紙1枚程度)

 5)着任後の研究と教育に関する抱負(A4用紙1枚程度)

 6)照会者2名の連絡先、もしくは推薦書

公募締切:2020年7月3日(金)必着


応募方法:サブジェクトに「マテリアルズインフォマティクス助教公募」として、提出書類(上記1)-6)のpdfファイルを1つのファイルとして圧縮、パスワード付き)を添付し、下記の応募専用メールアドレスに応募ください。また、別途パスワードもお送りください。

 提出書類送付先Email  :apply_2020_L01[at]ccs.tsukuba.ac.jp
 ([at]を@に置き換える)

パスワード送付先Email :shigeta[at]ccs.tsukuba.ac.jp
 ([at]を@に置き換える)

【問合せ先】
重田 育照(Tel: 029-853-6496,  Email:shigeta [at] ccs.tsukuba.ac.jp
)([at]を@に置き換える)

その他 :計算科学研究センターは,文部科学省共同利用・共同研究拠点に認定されており,計算機共同利用を含む学際計算科学を推進しています。筑波大学では男女雇用機会均等法を遵守した人事選考を行っています。

新型コロナウイルス感染症(COVID-19)対応の研究にCygnus, OFPが使われています

HPCI(革新的ハイパフォーマンス・コンピューティング・インフラ)が募集する新型コロナウイルス感染症(COVID-19)の「治療」「防疫」「創薬」「感染拡大に関わる分析・予測」などに関わる研究課題に、計算科学研究センターのスーパーコンピュータCygnus、及び計算科学研究センターと東京大学情報基盤センターが共同で設置・運営する最先端共同HPC基盤施設(JCAHPC)のスーパーコンピュータOakforest-PACSが利用されています。
 
Cygnus 1件
Oakforest-PACS 3件
 
詳細は以下のHPCIページをご覧ください。

ビッグデータを一瞬で解析する! 賢い計算アルゴリズムの開発

塩川 浩昭 准教授

計算情報学研究部門 データ基盤分野

膨大な量のデータを扱うビッグデータ解析では、解析にかかる時間がネックになります。塩川准教授は、限られた計算資源でビッグデータ解析を実現するための研究を進めています。

(2020.6.8 公開)

 

「普通のPCでビッグデータ解析」への挑戦

大量のデータ(ビッグデータ)から有用な情報を引き出す技術。それが、ビッグデータ解析です。例えば、大量のSNS上の情報からユーザーが欲しいと感じているサービスを把握したり、無数の実験や観測のデータから共通の法則を見出したりと、ビジネスでも学術研究の場面でも、ビッグデータ解析は広く活用されています。あなたのスマホ画面に興味のある広告が表示されたら、それもビッグデータ解析の結果かもしれません。

こうしたビッグデータ解析では、より大量のデータを扱うことが重要です。しかし、データ量が増えるということは、解析にかかる計算の量が増えるということであり、計算にかかる時間が増えることにつながります。「知りたいのは明日の天気なのに、予報のための計算に一週間かかる」というのでは困りますよね。

この課題の解決には、より賢く計算することで計算の高速化を進めることが必要です。

また、計算の高速化だけでなく省メモリ化もできれば、スーパーコンピュータ(スパコン)のような高性能の計算機がなくても、ビッグデータ解析が可能になります。

塩川准教授の研究では、普通のパソコンのような限られた計算資源で、大規模なデータ解析ができるようにするための賢い計算方法(アルゴリズム)の開発を行っています。

データ内のモチーフのくり返しに着目

ビッグデータ解析の中でも、複数の点と点をつないだネットワークを分析して、関連の強いものをグループ化していくことを、グラフデータ分析といいます。

グラフデータ分析のアルゴリズムを賢くするために、塩川准教授の研究では、“データの中に同じモチーフ(基調構造)が繰り返し現れ、その出現頻度には偏りがある”という現象(Data Skewness)に着目しました。実際のデータは、一見複雑なネットワーク構造に見えても、triangle、tree、path、などの特定のモチーフが繰り返し現れています(図1)。これまでの方法では、こうした繰り返し部分も全て計算していましたが、同じ構造に同じ計算を繰り返していては時間がかかります。そこで、繰り返し構造が出てきたら一つの塊とみなして中まで細かく計算しない、というように余計な計算を減らし、本当に計算しなくてはいけないところに絞ったアルゴリズムを作ることで、精度を落とさずに計算を高速化することに成功しました。

新しく開発した方法では、デスクトップパソコンで30億件のTwitterデータを6.7秒で解析することに成功し、これまでの方法より約1,000倍の高速化を実現しました。計算が速くなったことで、これまでデスクトップパソコンでは計算できなかったようなデータ量を計算することも可能になりました。

図1 左:頻出するモチーフ、右:Wikipedia記事のリンク構造 ネットワークの緑色部分は左のモチーフのいずれかに該当する部分(グレーの点と黒い線は該当しない部分)

 

ビッグデータ解析のアルゴリズムが高性能になることで、産業・医療・学術などさまざまな場面で、従来スパコンが必要だったような計算を誰もができるようになります。

例えば、たくさんのタンパク質を点、その相互作用を線とみなしたタンパク質相互作用ネットワークを分析することで、高効率に性質の似たタンパク質の探索ができるようになります。それによって、薬の候補や病気の原因となるタンパク質の探索が進み、創薬などの場面で活用されることが期待されます。こうした分析をより高効率にするために、塩川准教授の研究が役立てられています。

 

さらに詳しく知りたい人へ

 

同時に学べる、理学系博士課程とコンピュータ科学の修士課程 〜デュアル・ディグリー プログラム〜

 計算科学研究センターの取り組みを紹介する、CCS Reports! 第三弾。今回はCCSの人材育成の取り組みとして、デュアル・ディグリープログラム(DDプログラム)をご紹介します。現在DDプログラムに在籍する久米さんに、博士課程と修士課程それぞれの研究の内容や、両者を同時並行するプログラムの実態をインタビューします!(取材日:2016.12.27)

久米慶太郎 さん

別分野の博士課程と修士課程を両立 !? DDプログラムとは

筑波大学のデュアル・ディグリープログラムは、博士後期課程の学生が専攻分野とは異なる関連分野の知識を身につけるために、博士後期課程に在籍しながら関連分野の博士前期課程(修士課程)でも学ぶことができるという教育プログラムです。 計算科学振興室長の北川先生によると、もともと、コンピュータ サイエンス専攻と生物・数理物質との間でDDプログラムが始まったのは、計算科学研究センターが働きかけたから、という経緯があるのだとか。 計算科学研究センターでは、物理学・地球環境・生物学などのサイエンス分野の博士後期課程に在籍しながら、コンピュータ科学・データ科学分野の博士前期課程(修士課程)で同時に学ぶDDプログラムを推進しています!

DDプログラムについて

—- 久米さんはDDプログラムを活用して研究科2つに所属していらっしゃいますよね?

「生命環境科学研究科 生物科学専攻(博士後期課程2年)・システム情報科学研究科 コンピュータサイエンス専攻(修士課程2年)です。」(取材当時)

 

—- 博士を取るだけでも大変なのに、同時に別の専門で修士を取るのは、すごく大変そうですが、実際はどうなのでしょう?

「そうですね。僕はもともとDDプログラムを始めようと思い立つ前から比較的情報系に興味があって、情報系の授業もなんとかついていけるよ、くらいのベースの知識はあったので、そこまでの苦労はなかったかなと思います。DDプログラムに来たいという方は分野としての情報系にも興味があると思うので、下地はあるのかなと。

ただスケジュール的にはやっぱり厳しくなる時はありますね。生物の方(博士課程)は、授業はそんなにないんですが、情報のゼミにも出て、生物のゼミにも出て、情報の(修士の)授業にも出て・・・となるので、忙しくはあります。特に情報系は生物に比べてゼミの回数も多いので・・・」

 

—- 忙しそうですね。そもそも、なぜ、DDプログラムを?

「学部3年くらいの時に、実験実習でTAをしてくれた方がDDプログラムを受けていらしたので、それで知りました。まだその時は、自分が入ることまでは考えていなかったですけども。

そもそも、僕が生物学類に入った時が2000年代の後半で、次世代シーケンサ*1がかなり本格的に使われ始めた頃だったと思うんです。その時点で、かなりのデータが吐き出されていた。そういうビッグデータを扱うための知識が必要になってくるだろうな、そういう知識を身につけたいな、と思っていたんです。

学部3年の後半に研究室を選ぶんですけれど、ちょうどコンピュータ系に強いということで稲垣先生のところを訪問して、ビッグデータの扱いとかやってみたいと考えているんですけど、と相談しました。それで、卒業研究をしている間に、DDプログラムを受けてみては? という話も出たので、受けてみようかな、と・・・。」

*1 次世代シーケンサ:DNAを構成する塩基配列を読み取る装置をシークエンサーという。次世代シークエンサーは、それまでの第一世代シークエンサーとは原理が全く異なっており、一度の解析で膨大な配列データを読み取ることができるようになり、扱える遺伝情報の量が飛躍的に増えた。

 

—- もともと生物・情報の両方に興味があったんですね。では、DDプログラムを受けて良かったなと思うところはどこですか? 

「やっぱり、データマイニングとか機械学習のプロの方と、直接議論をして意見を頂けるのが一番大きかったかなと思います。この分野は日進月歩でなかなか追いつくのは大変なんですけれど、極端なはなし、最新の技術や手法は論文を追いかければなんとか・・・もちろん時間はかかりますけど・・・知識としては得ることができます。

じゃあ研究で具体的に使う時に、果たしてその方法を使うのが妥当なのか? とか、学習手法として別のものの方が適しているんじゃないか、とか、そういうところになると、実際に専門の方から意見がもらえるのは大きいですね。

『最新のものを使っとけばいいんじゃないか』とか、思ってしまうところを、直接正していただいて、気づかなかったところまで知識を頂けるのは、かなり力になりましたし良かった点かなと思います。」

—- DDプログラムの制度についても聞かせてください。学費や院試について耳寄り情報をぜひ。

「DDプログラムは2つの研究科に入りますが、学費は片方分でいい、というような優遇措置があります。院試は、基本的には普通に大学院に入るのと同じです。ただDDプログラムの時は、修士と博士、両方の受け入れ教員に『DDプログラムを利用して院試を受ける』ことの承諾書をもらって提出する必要があります。しかもそれの締め切りが、大学院入試の出願の締め切りよりもかなり前で・・・僕はその締め切りに気がつくのがかなりギリギリだったんですよね。

確かにWebに掲載されているんだけれど、結構広い範囲を見ないといけないし周知もされていないし・・・僕は締め切り当日に慌てて承認をもらいました。試験もそうですけども、期限があるものはどれほど頑張っても取り返しがつかないので、情報収集をしっかりすることが大事です!」

*年度や研究科によっても締め切りなどが異なります。最新の情報を得るように注意してください。

 

DDプログラムの醍醐味!? 別分野の知識と専門性を活かした研究

久米さんがDDプログラムで実際にどんな研究を進めているのか、その研究の中身に迫ります!

—- 2つの学位をとるということで、それぞれ別の研究をされているんですよね?

「大きなテーマとしては同じなんですけども、やっている内容としては微妙に違いますね。博士課程の生物の方では、どちらかといえば生物そのものを扱ったウェットな研究をしています。タンパク質を扱ったり、あるいは生物自体の遺伝子組み換えをしようとしたりしていて・・・。でも今は修士のまとめの時期なので、生物そのものは扱わないドライの方の研究を主にやっています。」(取材当時)

—- 生き物そのものを扱う研究と、全く扱わない研究。求められるスキルが全然違いそうです。DDプログラムを始めてから、生物系の学会だけでなく情報処理系の学会でも発表の機会が増えたという久米さん。生物以外が専門の方向けに作ったスライドを元に、研究の話を説明していただきました。

「修士課程、博士課程での研究に共通するそもそもの大きなテーマというのが、『真核生物の進化を研究する』というものになります。その中でも、『真核生物がほとんど必ず持っているミトコンドリア』を研究しています。

ミトコンドリアはもともと、ある生物が他の生物であるバクテリアを取り込んだものだと言われています。このミトコンドリアがあるおかげで、生物はそれまでは毒であった酸素を効率の良いエネルギーとして使えるようになりました。つまり、ミトコンドリアの存在は生物の進化にとても大きな影響を与えたとして、少なくとも分子進化とか真核生物の進化の分野では注目されて扱われてきた材料なんです。」

「ただ、いざミトコンドリアを調べようとしても、これがなかなか難しくて。例えば、小さな細胞の中からさらに小さなミトコンドリアだけをきれいに取り出して、質量分析などでミトコンドリア内に何があるのか、どんなタンパク質があるのかなどを調べるとします。でも、そもそもミトコンドリアをきれいに取り出す方法が、限られた生き物、ヒトですとかマウスですとかといったモデル生物などでしか確立されていないんです。他の生き物でやろうとすると、ミトコンドリアをきれいに取り出す方法を作るところからやりましょう、となるので、とても時間がかかるんですね。

うちの研究室でも、最終的にはそれを実現しようと取り組んでいる学生がいますけども・・・。まずミトコンドリアを取り出す前段階として、研究したい真核生物だけを培養するというのに、たぶん数人で数年かかっています。」

—- というと?

「途中で先輩が卒業してしまって、別の学生が引き継いだりですね。そうやって数人で3年、4年かけて、やっと最初のステップである「研究したい真核生物だけを集める」ことができるわけです。」

—- うわー・・・。それでもまだミトコンドリアは取れていないですよね。

「次のステップとしてミトコンドリアだけをきれいに取ってくることになって、それにまた何年か。それがうまくできたとしても、ミトコンドリアのタンパク質解析をする段階でうまく解析できるかどうか。進化の研究としてはスポット的に1、2種類だけ見るわけにはいかず、もっと全体的にみないといけないのに、1つの種類に3年も4年もかけていたら、まぁ現実的じゃないな、と。」

—- たしかに・・・。

「そこで、じゃあ細胞全部をすりつぶして、その中から必要なミトコンドリアのタンパク質に関する情報だけを取ってこよう、と。機械学習*2の手法を使えば低コストに出来るんじゃないか、というアプローチが出てきます。」

*2 機械学習:コンピュータがあらかじめ与えられたデータセットからパターンを分析し、そのパターンに沿って新たに与えられたデータを判断するという技術。

—- それが、主にシステム情報科学研究科 コンピュータ サイエンス専攻(修士課程)で研究している内容ですね。ミトコンドリアのタンパク質を調べたいわけですよね。細胞をすり潰して分析機器にかけて・・・という “実験” はイメージできるのですが、ミトコンドリアに関連する必要な情報を機械学習で、というのはどうすれば実現できるのでしょうか?

「機械学習となると、何らかのパターンを学習させる必要があるんですけども、幸いにして使えるものがありそうだというのはわかっていました。タンパク質を構成しているアミノ酸の配列は、図のような文字列として表現できます。ミトコンドリアのタンパク質では、少なくとも文字列の最初のほうに特徴があるということが先行研究からわかっていました。このパターンを学習させることで、合致するもの、しないものを選別させることができるはずです。ただ、例によって、機械学習を使ってミトコンドリアタンパク質をより分ける先行研究では、ターゲットにされているのはモデル生物だけだったんです。」

—- ヒトやマウスといった限られた生き物ですね。久米さんが研究しているような生物では機械学習の研究も進んでいなかった、と。

「先行研究では、僕や真核生物の進化の研究をしている研究者がターゲットにしているような、広い生物種には力不足です。そこで、僕はモデル生物以外の “非モデル生物” でも、ミトコンドリアのタンパク質を機械学習で予測できるようにしようという研究をしています。ミトコンドリアの中には、ミトコンドリアDNAといってミトコンドリアに必要な遺伝情報をもっているものもいますが、僕が研究しているような真核生物ではミトコンドリアDNAが退縮していたり失われてしまっていたりして、ミトコンドリアで必要なタンパク質の遺伝子は細胞本体の核DNAにあります。ということは、核DNAの情報をもとに細胞内でつくられたミトコンドリアタンパク質は、ミトコンドリアまで輸送されているだろう、とあたりがつきますので、ミトコンドリアに運ぶための目印、シグナルがあるはずです。そうしたミトコンドリアに運ぶための目印を使って、機械学習でミトコンドリアタンパク質を選別できるわけです。」

—- その目印を探すだけでも大変そうですね。

「はい。1からその目印を考えるのは大変です。同じようなことをやっている先行研究はモデル生物ですでにあるので、使える部分はそれを利用したほうが良いと考えています。僕がまずやったこととしては主にトレーニングデータとして信頼性のあるデータを集めてくる、というところになりますね。」

—- 「これがAだよ」「これがBだよ」というラベルのついたデータを用意して、まずはそれでコンピュータにAとBのパターンを覚えてもらう、というのがトレーニングデータですね。答えが確実にわかっているデータのセット(トレーニングデータ)で学習したところに、答えがわからないデータを持ってきて、A or Bを判定してもらう・・・?

「そうですね。最終的な使われ方としては、そういうところを想定していますね。ただ、そのラベルのついたトレーニングデータというところが肝になってきます。非モデル生物の場合、ミトコンドリアのタンパク質とされているものの中には、ちゃんと実験でそれを示しているものと、予測ソフトを使ってたぶんミトコンドリアのタンパク質だろう、とされているものが混ざっていて、後者が結構多いんですね。なので、ちゃんとそこを区別しているデータベースや論文を探して、信頼できるラベルのついたデータを集める必要がありました。」

—- そうしてトレーニングデータが集まったら、あとはコンピュータに入力するだけ・・・なんてわけには、もちろんいかないんですよね・・・。

「先行研究で使われていた学習手法(サポートベクターマシン)よりも、もうちょっと多くの特徴量やデータ量に対応した学習手法の方が目的に適っているのではないか、という指摘も頂いたので、学習手法も変えて(Gradient boostingなどのアンサンブル学習法)研究しました。あとはひたすら、トレーニングデータで学習させて、判定のパフォーマンスを測定して、精度が上がるようにパラメータを調整していく、という作業になります。

機械学習の精度はROCカーブというもので性能評価をするんですけれども、結論としては、これまでのモデル生物を対象としたトレーニングデータで学習させたものに非モデル生物のデータを渡して判定させた際のパフォーマンス(イメージ図左端)よりも、非モデル生物を対象としたトレーニングデータで学習させたものに非モデル生物のデータを渡して判定させた際のパフォーマンス(真ん中)の方が、性能が向上しました。

非モデル生物にもバリエーションがあって、退化的なミトコンドリアをもつものとそうでないものがいたりします。こういう違いは、学習に使っている特徴の違いとしても現れます。なので、退化的なミトコンドリアをもつグループのデータを既存の機械学習で判定しようとするととても精度が落ちてしまいます。そこで退化的なミトコンドリアをもつグループのデータだけを選び出してきてトレーニングをしたら(イメージ図右端)、かなりいい結果が出るようになりました。」

—- ミトコンドリアがどういう状態なのかなど、あらかじめ自分の調べたいものと近いグループをトレーニングデータにすることで精度があげられるようになっているんですね。

「そうですね。こういう機械学習を使ってくれる人は生物を扱っている人なので、このタンパク質がミトコンドリアに行くか調べたい! という時に、そのタンパク質をもっていた生き物のことはあらかじめわかっていることが多いので、その生き物がどの生物群に属しているかは選択してもらうという使い方を想定しています。

これまでにトレーニングデータ用に集めてきた生物群がだいたい11、12セットあるんです。先ほどでた、退化的なミトコンドリアをもつものがこのうちの3つです。この3つをトレーニングデータに含めるか、含めないか、ですとか、トレーニングデータのセットによって調べたいものの精度が変わります。

今は、このセット全部の組み合わせを作って、どれを一緒にすると精度が上がるのかを調べています。11セット中の2個使う、3個使う、4個使う・・・など、1000通り以上ですね。特徴が違うものが入れば精度が下がりますし、傾向が似ているものが入る分には、データが増えた方が精度は上がります。」

—- ある程度、自分が調べたいものがわかっていればいいと思うんですが、例えば全然未知の、なんだかわからない生き物に使ってみるというのは難しいですか?

「それも今ちょうどやっていて、全くわからないものを調べる時にはどういうセットを使ったらいいのかというのも、組み合わせを作って調べています。やっぱり何か一つ作ろうと思うと、そこまで検証して根拠を示したものを作りたいですね。」

—- 本当に、生物の知識とデータ科学の知識を駆使した研究ですね。ちなみに、博士課程の研究は?

「博士課程では生き物そのものを扱った実験をしています。具体的には、ミトコンドリアに運ばれるようなタンパク質に蛍光ラベルをつけて、本当にミトコンドリアに運ばれているのかを観察しようとしています。これも退化的なミトコンドリアをもつグループで研究しているのですが・・・こちらの方は、まだあんまり結果がうまく出ているとはいえないので(笑)」

(写真: 暗幕の中で蛍光顕微鏡を操作する久米さん)

—- 光らせる方はうまくいっていない?

「光らせるところまでは行っているんですけれども・・・。これも最初の話と同じで、うまく光らせる技術が確立している生物はモデル生物など一部の限られた生物なんですね。幅広く色んな生き物を見ようと思うと、それぞれで技術の確立をしていかなくてはならないので、時間もかかり難しいですね。」

—- 例えば、機械学習の研究の成果がでてくれば、そうした難しい実験の数を減らしたりすることもできますか?

「そうですね。機械学習の研究と実際の実験は独立したアプローチとして捉える必要はなくて、機械学習による判定は実験をする際に “あたりをつける” のに使えますし、実験で新しいデータがでれば機械学習のトレーニングデータに組み込んで精度をあげることができるので、お互いの助けになると思います。」

—- 2つの研究がお互いの助けになって、研究がより進んで行くんですね。今後の研究にも期待しています! 久米さん、ありがとうございました。

計算科学研究センターにおけるデュアル・ディグリープログラム

デュアル・ディグリープログラムは、研究者または高度に専門的な業務の従事に必要な能力や学識の修得を目指す博士後期課程学生に、専攻分野とは異なる関連分野の学識を修得させるプログラムを提供し、深い専門性と広い学識に加えて高い適応力のある人材の育成を目的とします。計算科学研究センターでは、物理学・地球環境・生物学などのサイエンス分野の博士後期課程に在籍しながら、コンピュータ科学・データ科学分野の博士前期課程(修士課程)で同時に学ぶDDプログラムを推進しています。学生が在籍するのは研究科になりますので、募集要項や入試関連手続きはセンターではなく研究科で行われます。計算科学研究センターの「計算科学振興室」でも、DDプログラムに関する相談、サポートを受け付けています。対応している研究科などの詳細は、以下のページをご覧ください。

計算科学振興室デュアルディグリープログラムについて

北川先生(計算科学振興室長)コメント:

「計算科学の分野では、物理・地球環境・生物といった科学の専門性と同時に、先端的な情報技術に精通しそれを実際に応用する能力を有することが重要です。両方の分野の知識や技術を体得し、複合的な視点から新たな計算科学を開拓できる人材を育成するために、センターでは今後もDDプログラムの推奨と支援を続けていきます。」

l   DDプログラム問い合わせ先(センターに関連するもの):

 計算科学振興室長 北川博之 教授kitagawa [at] ccs.tsukuba.ac.jp

 広報・戦略室 pr [at] ccs.tsukuba.ac.jp


取材協力:

久米慶太郎(くめ けいたろう)さん(生命環境科学研究科 生物科学専攻 博士後期課程2年/システム情報科学研究科 コンピュータ・サイエンス専攻 修士課程2年)

北川博之(きたがわ ひろゆき)教授

関連リンク:

計算科学振興室 http://www.ccs.tsukuba.ac.jp/research/research_promotion/promotion-office