Deprecated : The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
Rでisomap(多様体学習のはなし) | PDF
Recommended
PPTX
PDF
PDF
PPTX
PPTX
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
PDF
PPTX
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
PDF
PDF
PDF
PDF
PPTX
PDF
PDF
[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling
PDF
PPTX
近年のHierarchical Vision Transformer
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
PDF
LSTM (Long short-term memory) 概要
PDF
PDF
PPTX
PPTX
PDF
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PDF
PPTX
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
PDF
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
More Related Content
PPTX
PDF
PDF
PPTX
PPTX
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
PDF
What's hot
PPTX
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
PDF
PDF
PDF
PDF
PPTX
PDF
PDF
[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling
PDF
PPTX
近年のHierarchical Vision Transformer
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
PDF
LSTM (Long short-term memory) 概要
PDF
PDF
PPTX
PPTX
PDF
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PDF
PPTX
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
Similar to Rでisomap(多様体学習のはなし)
PDF
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
PPTX
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
PDF
最近傍探索と直積量子化(Nearest neighbor search and Product Quantization)
PDF
PDF
PDF
PDF
PPTX
Angle-Based Outlier Detection周辺の論文紹介
PPT
PPTX
PDF
PDF
PPTX
PDF
PDF
PDF
PPTX
PDF
PPTX
More from Kohta Ishikawa
PPT
PDF
Introduction to statistics
PDF
PDF
[Paper reading] Hamiltonian Neural Networks
PDF
Particle Filter Tracking in Python
PDF
Introduction to pairtrading
PDF
Spherical CNNs paper reading
PDF
Model Transport: Towards Scalable Transfer Learning on Manifolds 論文紹介
PDF
A brief explanation of Causal Entropic Forces
PDF
R Language Definition 2.2 to 2.3
PDF
Nonlinear Filtering and Path Integral Method (Paper Review)
Recently uploaded
PDF
論文紹介:Simultaneous Detection and Interaction Reasoning for Object-Centric Acti...
PDF
論文紹介: "Locality-Aware Zero-Shot Human-Object Interaction Detection" "Disentan...
PDF
論文紹介:"MM-Tracker: Motion Mamba for UAV-platform Multiple Object Tracking", "M...
PDF
論文紹介:"Reflexion: language agents with verbal reinforcement learning", "MA-LMM...
PDF
AIアクセラレーターが切り拓く未来: 技術革新の加速とそれがもたらす社会的・経済的影響
PDF
Marp - MarkdownとCSSでスライド作成 2025/10/31の勉強会で発表されたものです。
PDF
「Technology×Business×生成AI」株式会社CoToMaで未来を作る!
PDF
AIアクセラレータの力で加速する人工知能の未来: 技術革新と産業革命を促進する力
PDF
AIプロセッサの未来: 革新技術が切り開く次世代コンピュータ革命とその無限の可能性
PDF
AIアクセラレーターの力で加速する次世代AI技術: 革新が変革するテクノロジーの未来
PDF
ADAS自動車の未来: 次世代運転支援技術が実現する新たな運転体験とその進化の可能性
PDF
ADAS自動運転の未来: 次世代の技術革新が切り開く新しいモビリティ社会とその可能性
PDF
ReflecTrace: Hover Interface using Corneal Reflection Images Captured by Smar...
PDF
手軽に広範囲でプライバシーを守りながら人数カウントできる ~ LoRaWAN AI人流カウンター PF52 日本語カタログ
PDF
歴史好きのスクラム話 JBUG名古屋#5 AI時代のデータドリブンなプロジェクト管理
Rでisomap(多様体学習のはなし) 1. Tokyo.R #14
Rでisomap
(多様体学習のはなし)
2011年5月28日
Tokyo.R #14
Kohta Ishikawa (@_kohta)
1
2. Tokyo.R #14
アウトライン
l 多様体学習って?
l 線形と非線形
l isomap
l 実装してみた
l 実務的な難しさ
2
3. Tokyo.R #14
多様体学習(manifold learning)?
l 非線形な多様体(manifold)上に分布するような
データの構造を学習する一連の手法
l 例えば、高次元空間に埋め込まれた実質的に低次
元な多様体を学習することで、非線形データの低次
元表現が可能になる
l データの分布構造が線形なら…
l 主成分分析 (線形変換によって低次元でデータをよ
く説明しようと試みる)
l 因子分析
l etc…
3
4. Tokyo.R #14
多様体?
l 定義
松本幸夫「多様体の基礎」 (東京大学出版会)より
位相空間Mが次の条件(1),(2)をみたすとき、Mをm次元位相多様体
(topological manifold)という。
(1) Mはハウスドルフ空間である
(2) Mの任意の点pについて、pを含むm次元座標近傍(U,φ)が
存在する。
座標近傍:
位相空間Xの開集合Uから、m次元数空間Rmのある開集合U’への
同相写像
Φ: U → U’
があるとき、Uとφの対(U,φ)をm次元座標近傍といい、φをU上の
局所座標系という。
4
5. 6. Tokyo.R #14
なんということはない
l 一見高次元に見えるデータが、実はもっと低次元の
構造しか持っていない場合がある
l そういうデータを適切に学習したい(多様体学習)
Sam T. Roweis and Lawrence K. Saul
“Nonlinear Dimensionality Reduction
by Locally Linear Embedding”
SCIENCE (2000)
スイスロール → 3次元とみせかけて2次元
(ただし曲面上に分布している)
曲面の構造 ∈ 多様体
6
7. Tokyo.R #14
線形な次元削減
東京大学大学院 情報理工学研究科
l 主成分分析 数理情報学専攻 中川研
公開資料より図表抜粋
l 次元削減と言えばこれ http://bit.ly/hhSlyB
l 非線形データに対してはうまくいかない
主成分分析
どうやって(線形な)座標変換をしても
低次元で上手くデータを説明できない
7
8. Tokyo.R #14
非線形な次元削減
l Isomap
l LaplacianEigenmap
l Kernel PCA etc…
うまい座標変換を施して、低次元でデータを説明したい
8
9. Tokyo.R #14
isomap
l 非線形次元削減手法のひとつ
l K近傍グラフを用いて多様体上の測地線距離を(近
似的に)求め、多次元尺度構成法を用いて近似的に
ユークリッドな低次元空間に射影する
9
10. Tokyo.R #14
測地線?
l 定義
Wikipediaより
リーマン多様体上の微分可能な曲線x(τ)が
を満たすとき、x(τ)を測地線という。
ここで はアフィン接続である。
10
11. 12. Tokyo.R #14
難しいのは単語だけ
測地線距離が欲しいので、各点について近場の点だけは
2点間のユークリッド距離は ユークリッド距離でつなぐことにする。
データの構造(本当の「遠さ」) そうしてできたグラフ(ネットワーク)を辿って最短距離を見出せば
を反映していない
測地線距離に近いものが計算できると期待する。
グラフの2次元表現
2点間の本当の「遠さ」を表しているのは 各点の近場のk点を直線距離でつないだグラフ
データが分布する面(多様体!)に沿った
距離
測地線距離
K近傍グラフ
12
13. 14. Tokyo.R #14
他に何が必要?
点データ
K近傍グラフの作成
測地線距離行列の作成
点間の距離データから
適切な座標値を計算!
多次元尺度構成法
点データの低次元マップ表現
14
15. Tokyo.R #14
多次元尺度構成法
l 点間の距離データのみが与えられた場合に、点を
上手く座標空間に表示する(座標値を求める)方法
l Tokyo.R #09
l http://www.slideshare.net/yokkuns/tokyor09
l 私のブログ
l http://d.hatena.ne.jp/koh_ta/20110514
15
16. Tokyo.R #14
多次元尺度構成法
距離行列(の成分2乗) ダブル・センタリング変換
Dij=dij2 K = -1/2 HDH
Hij = δij – (1/n)1ij
・Kの固有値が正(正定値)でなければならない
・距離がユークリッドでないときは一般に負の固有値が現れる
・isomapでは負の固有値は無視して固有値の大きい順に
いくつか(2,3次元)を採用する
⇒ 低次元表現!
・測地線距離のユークリッド性が弱いときは近似が悪くなる
16
17. Tokyo.R #14
Rにisomapがない
l たぶんない
l Pure
Rで実装すると重くてむり
l データ1000個 → 20分くらい…
17
18. Tokyo.R #14
あらためて探したらあった
l veganパッケージ
l 植生関連の人向けのパッケージ
dist(d) : dist形式(ユークリッド距離)データ
ndim : 出力する次元
k : k近傍グラフの近傍数
18
19. Tokyo.R #14
C++で書くかRcppとかあるし
とか言って大体書いたあとに見つけた
l Rcpp
l RとC++の連携を便利にしたRパッケージ
l 先人達のとてもすばらしい資料群
l @sfchaos
l http://www.slideshare.net/sfchaos/tokyor7rcc
l @mickey24
l http://www.slideshare.net/mickey24/extend-r-with-
rcpp
l Pure Rに比べてだいたい10~100倍くらいは速い
19
20. Tokyo.R #14
書いた
l CPPLapackというすばらしいLapackのクラスラッ
パーがある
l LapackはFortran臭がきつい
l CPPLapackは行列クラスも定義しているので、和
や積などの行列演算も簡単
l ただしLapackのフル機能が使えるとは限らない…
l 実際Rのcmdscale関数(Fortran実装)が使ってい
る_dsysvxルーチンは使えないっぽい
20
21. 22. Tokyo.R #14
実行結果
l まだ微妙にバグがあります…
l でもほぼあってます
元データ
2次元マップ
22
23. Tokyo.R #14
で、実際使えるの?
l 実務的に使える手法の条件(例)
l 手法が理解しやすいこと
l 結果の解釈が容易であること
l 直感と外れない結果が出ること
l etc
23
24. Tokyo.R #14
非線形の(実務的)むずかしさ
l 手法が複雑になりがち
l 結果の解釈が難しくなりがち
l なんでそういう結果が出たのか?
l 次元削減に使った非線形変換の性質を元の座標系
(=実務的に意味がある量)で説明できるのか?
l 主成分分析等は簡単(性質=主成分寄与率、因子付加量
など)
l 結果を直感で解釈できるかどうかは問題による
l 構造に興味を持たない範囲(単純な分類など)では
使えるんじゃないか
24
25. Tokyo.R #14
Isomapの実用的むずかしさ
l K近傍グラフのKをいくつにするべきか?
l Kが小さすぎると全体が正しく連結されない
l Kが大きすぎると多様体の構造が正しく反映されない
l 多分色々研究があると思いますがぶっちゃけあまり調べて
ないです…
l マッピングルールの解釈が不可能
l 元の点⇒測地線距離⇒多次元尺度法
25
26. Tokyo.R #14
kの値による変化
l 少なすぎても多すぎてもだめ
l 具体的なkの値はバグもあるので「だいたい」と思ってください
k=4(少なすぎ) k=8(丁度良い) k=20(多すぎ)
多分バグがとれるとk=5,6
あたりで丁度良くなります
26
27. Tokyo.R #14
kの値による変化
l kが少ないとグラフが分断してしまう
l kが多いと多様体の構造を無視して繋がってしまう
k=4 k=8 k=20
snaパッケージのgplot関数を利用
27
28. Tokyo.R #14
今後
l Isomapはあったから他の多様体学習を実装して
差別化したい… (with @sfchaos)
l パッケージ周りの細かいことを色々調べないと…
l winとlinuxの動的ライブラリの違いとか
28
29.