配属案内(B3向け)

曹研究室 (Cao Lab / Trustworthy Data Science & AI Lab)


研究室見学用資料(学内限定)

研究室の全体像は、まず以下の資料をご覧ください。
いずれも Science Tokyo アカウントでログインすると閲覧できます。


研究内容

Cao Lab(Trustworthy Data Science & AI Lab)では、
「AI・データサイエンスを安心して社会で使えるようにするにはどうすればよいか」
という根本的な問いに取り組んでいます。

近年の AI(特に大規模言語モデルや生成AI)は非常に高い性能を示していますが、一方で、

  • 学習データや利用時の入力から、個人情報・機密情報が漏えいしないか
  • 悪意ある操作や攻撃によって、モデルやシステムが不正に利用されないか
  • 出力結果はどこまで正確で信頼でき、現実世界に悪影響を与えないか

といった 「信頼性(Trustworthiness)」の問題 が顕在化しています。

Cao Lab では、こうした課題に対して、
プライバシー・セキュリティ・ロバストネス・透明性 などの観点から、
理論と実システムの両面を意識した研究を行っています。

研究トピックの例

  • 差分プライバシー(Differential Privacy)の理論と応用
    生データを直接公開せずに学習・分析を行うための理論と実装
  • 連合学習(Federated Learning)
    分散したデータを共有せずに学習する仕組みと、その安全性
  • LLM / 生成AIのプライバシー・セキュリティ・セーフティ
    訓練データ漏洩、推論時の情報流出、攻撃・ハルシネーションの問題
  • RAG(Retrieval-Augmented Generation)の信頼性
    検索と生成を組み合わせたAIにおける安全性・評価・攻撃耐性
  • Agent AI / 自律エージェントの信頼性とセキュリティ
    長期メモリや行動方針を持つAIエージェントに対する
    操作・汚染・意図しない振る舞いのリスク分析と防御
  • Embodied AI のプライバシー・安全性
    ロボットや実世界センサを持つAIが収集する
    行動・環境・個人情報の保護と信頼性
  • XR / VR 環境におけるプライバシーと信頼
    視線・動作・空間情報など高次元個人データの
    収集・推論・悪用リスクとその対策
  • データの価値・データマーケット
    データを「安全に使う」「正しく評価する」ための
    技術・制度・エコシステム設計

B4 の研究では、Trustworthy Data Science・AIのテーマの中から、 「どこが問題なのか」「なぜそれが重要なのか」を明確にし、 実験・分析・実装を通じて検証していきます。
研究テーマは、本人の興味を起点に設定します。


この研究室で「何ができるようになるか」

研究室選びで重要なのは、研究分野そのものだけでなく、
「ここに来たら、どんな力が身につくか」を具体的に想像できることです。

Cao Lab では、B4/M1 の段階から、次のような力を段階的に身につけることを重視しています。

1. 研究の基本スキル

  • 論文を読む力
    関連研究を整理し、「何が分かっていて、何が未解決か」を言語化する
  • 研究課題を立てる力
    Research Gap(研究の穴)を見つけ、実行可能なテーマに落とし込む
  • 実験・評価の力
    比較(baseline)を設計し、再現性と説得力のある評価を行う
  • 書く・発表する力
    卒論や発表で「What / Why / How」を筋道立てて説明する

2. 「信頼できるAI」を扱う力

差分プライバシー、連合学習、LLM / RAG の安全性など、
AIを社会で使う上で不可欠な「信頼性」の課題を扱います。

B4 であっても、

  • どこが危険か(攻撃・脅威)
  • どう守るか(防御・設計) の 両面を意識した研究に取り組めます。

3. 国際的に発信・活動する力

  • 英語論文を読み、内容を理解して議論できる力
  • 研究内容を 英語で説明・発表する力(スライド・ディスカッション)
  • 国際会議・国際的な研究コミュニティを意識した研究の進め方

国際的に活躍するための環境・育成方針

Cao Lab は International / Multicultural な研究室運営を明確な方針としています。
目標は、卒論を書いて終わりではなく、将来的に 国際的に通用する研究者・エンジニアとして活躍できる基礎を作ることです。

1. 日本語・英語併用の研究環境

  • 研究室内のコミュニケーションは 日本語/英語の併用
  • 最初から流暢さは求めませんが、英語を避けない姿勢は大切にしています
  • 論文読解や発表を通して、B4の段階から少しずつ慣れていきます

2. 国際性のあるメンバー構成・交流

  • 国際的なメンバーや訪問研究者が在籍することがあり、日常的に多様な視点に触れられます
  • 海外研究者・研究室との交流や共同研究の機会を大切にしています

3. 将来を見据えた育成ステップ

  • B3:研究プロセスを体験 (曹研究室のB3プロジェクトに参加した場合)
  • B4:自分で研究を進められる状態へ (調査 → 仮説 → 小さな検証)
  • M1:国内・国際会議での発表を目指す
  • M2:国内外研究者と共同研究できるレベルへ
  • D :独立した研究者として研究を主導できるレベルへ

B4 の進め方(例)

B4 では、概ね次の流れで研究を進めます(個人差はあります)。

  • 4–5月:Orientation(分野理解・基礎固め)
  • 6–7月:Research Gap を見つけ、テーマを確定
  • 8–9月:関連研究の調査(survey)
  • 10–11月:実験・結果分析
  • 12–1月:卒論執筆
  • 2–3月:卒業発表/(可能であれば)外部発表

ミーティングと研究の進め方

研究が前に進むよう、仕組みとしてのサポートを重視しています。

  • グループミーティング(月1~2回程度)
    研究共有、関連研究紹介、論文紹介など(日本語/英語)
  • 個人ミーティング(週1回程度)
    進捗確認、進め方の相談、次に読むべき論文や実験設計の議論など
  • No core time
    コアタイムは設けず、各自が計画的に進めます(自己管理が前提)

こんな人に向いています

求めていないこと

  • 研究経験がすでにあること
  • 数学やプログラミングの「天才」であること

大切にしていること

Cao Lab では、最初からの経験や完璧さよりも、
研究にどのような姿勢で向き合うかを大切にしています。

  • 主体的に動けること
    自分で状況を整理し、分からない点や次にやるべきことを考えた上で、
    相談・提案・実行につなげられること。
  • 学びを次に活かせること
    論文、議論、フィードバックから学んだことを振り返り、
    次の実験や考察に反映できること。
  • やり切れること
    うまくいかない実験や手戻りがあっても、原因を考えながら粘り強く取り組み、
    最終的に成果としてまとめきれること。

英語について

  • 英語が得意である必要はありません。
  • ただし、国際的に活躍することを育成目標としているため、
    英語に強い抵抗がないことは重視しています。

よくある質問(FAQ)

Q. 研究未経験でも大丈夫ですか?
A. 問題ありません。最初の1–2ヶ月は Orientation として、分野理解や研究の進め方を丁寧に整理します。

Q. テーマはどのように決まりますか?
A. 本人の興味を起点に、教員・先輩と相談しながら方向性を整理します。
候補の提示はありますが、具体的なトピックは本人が決めます。

Q. 英語が不安です。
A. 最初からできる必要はありません。日本語/英語併用の環境で、段階的に慣れていきます。

Q. 週どれくらいコミットが必要ですか?
A. 月1~2回程度のグループMTGと週1回程度の個人MTGが基本です。加えて、自主的な作業時間が必要になります。


見学・相談

  1. まず上の 研究室見学用スライド をご覧ください。
  2. 見学・相談希望の方は、学内Slack または cao@c.titech.ac.jpにご連絡ください。 (どちらでも構いません)
  3. 見学では、研究内容だけでなく 「テーマの決め方」「日々の進め方」「国際的な活動機会」なども説明します。
    (学生から直接話を聞くこともできます)