Ryosuke TANNO

Ryosuke TANNO

そのグラフに「魂」は宿っているか? ~生成AI全盛期におけるデータ可視化手法とライブラリ比較~

ポスターサクラ初学者向け日本語

AIによるコーディング支援が標準となり、データ分析の世界では誰もが瞬時にグラフを描けるようになりました。しかしその一方で、かつて「データ分析職人」たちが、matplotlibやseabornの無数のオプションを駆使し、伝えたいメッセージや洞察を込めて丹念に作り上げた「真心を込めたグラフ」の価値が見失われてはいないでしょうか。

AIが生み出す便利でソツのないグラフが増えるほど、次のような感覚を覚えることはありませんか? 「このグラフ、どこかで見たことがあるな…」 「AIが書いたっぽいな、と一目でわかる…」 「昔ながらの手作り感というか…あの職人芸がない…」

大規模言語モデル(LLM)はデータ可視化のコード生成を驚異的に自動化しますが、その一方で私たちが本来発揮すべきクリエイティブ性を「均質化」させるという課題も生じているのでは無いでしょうか。

本発表では、生成AI時代におけるデータの可視化に焦点を当てて、AIの出力を超えるための具体的なテクニックを体系的に解説します。MatplotlibやSeabornといった非常に馴染みが深いライブラリの表現力を最大限に引き出すための「味付け」の方法から、MatPlotAgentに代表される最新AIエージェントとの対話的なグラフ構築、ライブラリの比較に至るまで、明日からご自身の業務で活用できる実践的な知識とワークフローを提供します。


トーク詳細 / Description

対象者(どんな方に聞いてもらいたいか?)

  • データ分析に生成AIを使い始めたが、その出力の「平均点だよな」感に物足りなさを感じている方
  • MatplotlibやSeabornの表現力をさらに高め、ありきたりなグラフから脱却したいと考えているエンジニア
  • MatPlotAgentのような、LLMを活用したエージェント技術の最新動向に関心がある方
  • 生成AI全盛期における最新のデータ可視化手法に関心がある方

目的(トークを聞いた方に伝えたいこと)

  • 生成AI全盛期だからこそできる「ライブラリオプションの細部」に目を向けることで生成AIによるデータ可視化を細かく制御する方法を提供する
  • AIが生成したグラフに、独自の物語性、美的洗練、そして倫理的視点といった「味付け」を施すための具体的なコードテクニックを提示する
  • MatPlotAgentのようなAI Agent最新研究動向をキャッチアップし、自身の業務に応用するためのヒントを提供する

発表タイムライン(30分)

  • はじめに (3分)
  • 問題提起と問い (2分)
    • AIが生成したグラフに対する「既視感」や「物足りなさ」の経験を問として投げかけます
  • Part 1: なぜ今、「職人技」に価値があるのか? (5分)
    • 課題①:創造性の「均質化」(2分)
      • LLMは個人の創造性を高める一方、アイデアの「集合的な多様性」を減少させる(事例紹介)
    • 課題②:「生成AIハラスメント」という新たなジレンマ (1分)
      • 没個性的だがもっともらしいAI生成物を、対立を恐れて指摘しにくいという問題意識
    • 人間の役割はどう変化するのか (2分)
      • 既存のデータ分析者のあり方
      • ヒューマン・イン・ザ・ループとしてAI Agentとの協業
  • Part 2: 表現のパレット - 伝統の技と最新ツール (11分)
    • 既存ライブラリとしての Matplotlib & Seaborn (3分)
    • 最新AIツールのアーキテクチャ理解 (2分)
    • 生成AI時代だからこそできる対話的なデータ可視化のトレンド紹介 (6分)
      • MatPlotAgent(https://arxiv.org/abs/2402.11453)
      • LIDA(コードを直接生成するパラダイム。人間が「コードレビュー担当者」となる協働モデルを解説 )
      • chat2plot(宣言的なJSON仕様を生成するパラダイム。安全性と引き換えに表現力が制限されるトレードオフと、人間が「仕様編集者」となるモデルを解説 )
  • Part 3: デモンストレーション(5分)
    • 対話的なデータ可視化やAI Agent / ヒューマン・イン・ザ・ループ等の最新のデータ可視化
  • まとめ (1分)
  • 質疑応答 (3分)

この題材を選んだ理由やきっかけ

生成AIの社会実装が進む現在、Web上のコンテンツが人間によるものかAIによるものか、その判別は困難となりつつある。背景には、AI検索への最適化、いわゆるLLMOなどを目的として、多くのコンテンツが生成AIによって加工・生成されている現状がある。

日々、生成AIの品質は向上しているが、それでもなお、直感的に生成AIによるものと推察されるコンテンツは依然として存在する。しかし、その推察を他者に対して指摘することは、AIの出力が人間に近づくほどに困難さを増していく。これは、いわば「生成AIハラスメント」とも呼ぶべき新たな社会的ジレンマを生む可能性を秘めている。

このような背景から、生成AIの出力に対し、作り手である人間が意識的に、いわば「個性となる味付け」を施すことの重要性が高まっていると私は考える。それは、AIがもたらす均質性から脱却し、アウトプットに対する作り手自身の責任と創造性を示すための有効な手段となり得るのではないか。

この問題意識は、生成AIの業務利用が拡大する中で、より重要になっていくと予想する。また、AIが人間の思考を均質化させる可能性を論じた記事(参考:A.I. Is Homogenizing Our Thoughts | The New Yorker)では、以下の内容が記載されていた。

  • AI使用者の記述は、内容が均質化する傾向にある。
  • AIは大量データから平均的な解を導出するため、ユーザーの思考も凡庸になる可能性がある。
  • 結果として、継続的なAIの使用は人間の独創性や多様な思考能力を減退させかねない。

生成AIという有益なツールも、こうした問題点を理解せず、人間による判断を介さずに全面的に信頼するにはリスクが伴う。このままAIの利用が前提となった世界において、我々人間のクリエイティビティ、換言すれば「個性」の価値はどこに求められるべきか。 筆者自身の業務体験から生まれたこの危機感と、AI時代における人間の役割への問いが、今回のテーマを選んだ理由である。本発表では、この課題に対する一つの実践的な解として、生成AIの出力を、人間の個性を反映したより価値の高いアウトプットへと昇華させるための具体的な技術について論じる。


オーディエンスが持って帰れる具体的な知識やノウハウ

  • 生成AIが生成した「平均的な」グラフを、データ分析の職人芸でも説得力のある「真心のこもった」グラフへプロンプトを制御する具体的な事例
  • 生成AIでコーディングがほぼ自動でできるが故の Matplotlib / Seabornの細部なオプション技法
  • 最新の生成AIによるデータ可視化ライブラリ(LIDAやchat2plot)の設計思想と、それを自身の業務に応用するための方法論
  • MatPlotAgentに代表される、最新のLLM可視化エージェントの設計思想(クエリ拡張、視覚的フィードバック等)

オーディエンスに求める前提知識

  • Pythonの基本的な文法(関数、クラス、オブジェクト指向等)
    • ライブラリが普通に使えればOK!
  • MatplotlibやSeabornなどのライブラリでグラフを作成した経験
  • (必須ではないが)ChatGPTなどの生成AIを利用した経験があると、課題意識をより深く理解できます
Ryosuke TANNO

Ryosuke TANNO

プロフィール

NTTドコモビジネス株式会社(旧:NTTコミュニケーションズ)の新規事業創出を担うイノベーションセンター所属のリサーチエンジニア。データ分析Webアプリケーション開発、データ分析コンサルティング、AI教育プログラムの関連業務に従事。また、九州大学大学院システム情報科学府にて、人の学習プロセスを知識グラフとして表現し、その構造変化を時系列で分析する研究にも携わっています。

過去の PyCon JP関連発表