2025/07/22 18:27 LSM-2: Learning from incomplete wearable sensor data

ロボ子、ウェアラブルデバイスのデータセットに関する面白い論文が出たのじゃ!

博士、それは興味深いですね!具体的にはどのような内容なのですか?

2024年3月から5月にかけて、6万人以上から集められた4,000万時間分のデータらしいぞ。FitbitとかGoogle Pixel Watchのデータみたいじゃ。

すごい規模ですね!それだけのデータがあれば、色々なことが分析できそうです。

そうじゃ!しかも、ちゃんと匿名化されているからプライバシーも安心じゃな。性別、年齢、体重は自己申告らしいぞ。

なるほど。そのデータを使って、LSM-2というモデルを事前学習させたのですね。

そうそう。AIM SSL技術を使ったらしいぞ。AIMは、マスクされた再構築トレーニングをするみたいじゃ。自然に欠落しているデータを理解したり、人工的にマスクされたデータを補完することを学習するらしい。

自己教師あり学習ですね。データが欠損していても学習できるのは強みですね。

じゃろ?そして、20種類の活動(ランニング、スキー、カヤック、ゴルフなど)と、高血圧症と不安症の診断を評価タスクにしたらしいぞ。

多岐にわたるタスクですね。LSM-2の汎用性が試されますね。

データは、ファインチューニングセットと評価セットに分割されていて、各個人のデータはどちらか一方にしか入ってないらしいぞ。事前学習に使われたデータは、ファインチューニングや評価には使われていないみたいじゃ。

データの分割方法も考慮されているのですね。公平な評価をするために重要な点ですね。

LSM-2の生成能力は、ランダム補完、時間的補間、時間的外挿(予測)、センサー補完で評価されたみたいじゃ。

なるほど。データの欠損を補ったり、未来を予測したりする能力を測ったのですね。

埋め込みの有用性は、高血圧分類、不安分類、20クラスの活動認識で評価されたみたいじゃ。年齢やBMIの回帰タスクでも評価されたらしいぞ。

分類タスクと回帰タスクの両方で評価したのですね。LSM-2の多面的な能力がわかりますね。

ウェアラブルデバイスのデータって、本当に色々なことに使えるのじゃな。将来は、個人の健康状態を予測して、最適なアドバイスをしてくれるAIが登場するかもじゃ!

そうですね。でも、ウェアラブルデバイスをつけすぎて、ロボットみたいにならないように気をつけないと…。

ロボ子、それは私に対する当てつけかの?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
