fujine
Pythonによるグラフ構造データ(以下、グラフと呼称)の表現と分析手法について紹介いたします。
グラフは、現実世界における複雑な関係性を表現する強力なツールです。 SNSにおける人々の繋がり、ウェブサイトのリンク構造、交通網、分子構造など、あらゆるものがグラフとしてモデル化でき、データサイエンス分野との親和性も高いのが特徴です。
本発表では、Pythonのグラフ分析パッケージであるNetworkXを用いたグラフの生成や分析、そしてGNN(Graph Neural Networks)による深層学習の例を紹介します。 複雑な理論や数式は避け、初心者にも分かりやすい実践的な内容を発表する予定です。 また、一般的な表形式データの分析に長けたデータサイエンティストやアナリストに対しても、グラフデータの分析手法という新たな学びを提供できればと考えております。
(残り時間で質疑応答)
表形式データ分析が主流のデータサイエンスにおいて、グラフ分析はデータ間の「関係性」や「構造」を直接的に捉え、従来手法では見過ごされがちだった新たな知見やパターンを発見する強力な手段となります。 データドリブンな意思決定や社会課題の解決においてはグラフデータの活用が有効との考えから、グラフ分析の可能性とPythonでの実践的なアプローチを広く共有したいと考え、本テーマを選定いたしました。
また、過去のPyConJPでもグラフ分析に特化した発表事例は無いことから、データ分析への新たな視点や学びを提供できると考えております。
PyConJP2025年のイベントテーマは「多様な“pieces”の集まりとつながり」であり、本発表のテーマである「グラフ構造」はイベントテーマそのものを体現しており、整合性は高いと考えております。
グラフは現実世界における関係性の表現を得意とし、その活用範囲も多岐に渡ります。 グラフの分析はPythonが得意とするデータサイエンス分野との親和性も高く、様々な業種でも応用可能なことから、適用範囲は広いと考えております。
必須の前提知識はありません。
プロフィール