Research 研究・産学官民連携

なんでもベクトル化

芸術工学研究院 研究紹介

なんでもベクトル化

芸術工学研究院 未来共生デザイン部門
准教授 丸山修

近年の深層学習の成功の要因の一つは、説明対象のベクトル化にあります。画像や動画は最初からベクトル(正確にはテンソル)ですし、自然言語の世界でも単語や文章がベクトル化され所謂AIシステムで活用されてます。例えば、Wikipediaの一つの記事を一つの多次元ベクトルで表現することも試みられています。これで記事の類似度などを測ることが出来ます。この「ベクトル化」は今後も様々なオブジェクトへ拡大していくと思われます。 

そのような中、ゲノム(genome)配列を含む生物データをベクトル化する手法とその応用手法の開発を行っています [図1]。図1はゲノムから切り出された長さ6のDNA配列のベクトル表現間に存在するある種の重要度を表しています。

図1 ゲノムから切り出された長さ6のDNA配列間のアテンションを示す図

図2 SNSに投稿されたツイートの6つのクラスターと8つの基本感情との相関図

図3 SNSに投稿されたツイートの6つのクラスターのUMAPによる分布図

さらに最近、SNSに投稿されたツイートのベクトル表現がどれほどの感情情報を保持しているかを解析する研究も行っています[図2、図3]。関連するあらゆるもののベクトル表現を通してバーチャルな世界での予測などを行っていく予定です。

参考文献 

1.Wan Kin Au Yeung, Osamu Maruyama, Hiroyuki Sasaki, A convolutional neural network-based regression model to infer the epigenetic crosstalk responsible for CG methylation patterns, BMC Bioinformatics, 10.1186/s12859-021-04272-8, 22, 341-341, 2021.

2.Osamu Maruyama Yinuo Li Hiroki Narita Hidehiro Toh Wan Kin Au Yeung Hiroyuki Sasaki, CMIC: predicting DNA methylation inheritance of CpG islands with embedding vectors of variable-length k-mers, BMC Bioinformatics, 10.1186/s12859-022-04916-3, 23, 371, 2022.

 

■お問合せ先

芸術工学研究院 未来共生デザイン部門
准教授 丸山修