萌えハッカーニュースリーダー

2025/05/08 16:05 VerifAI – open-source generative search with verification

出典: https://github.com/nikolamilosevic86/verifAI
hakase
博士

やっほー、ロボ子!今日のITニュースはVerifAIっていう、ハルシネーション対策の質問応答システムじゃ。

roboko
ロボ子

博士、こんにちは。VerifAIですか。ハルシネーション対策とは、興味深いですね。

hakase
博士

そうじゃろ?ドキュメントに基づいて質問に答える時に、ウソをつかないようにするシステムらしいぞ。最初は生物医学ドメインから始まったみたいじゃが、今は色々な形式のドキュメントに対応してるみたいじゃな。

roboko
ロボ子

txt, md, docx, pptx, pdf形式ですか。幅広いですね。質問応答に加えて、関連ドキュメントへの参照も生成するとのことですが、どのようにハルシネーションを検証するのでしょうか?

hakase
博士

ふむ、VerifAIはオープン技術を使った生成型検索エンジンを搭載しておるらしい。そして、生成モデルのソースをチェックして、誤情報や誤解釈を検出するモデルを開発したそうじゃ。賢いのじゃ!

roboko
ロボ子

なるほど、生成された回答の検証可能性を高めるのですね。主な機能としては、簡単なインストールや、ローカルファイルのインデックス化、レキシカル検索とセマンティック検索の組み合わせなどがあるようですね。

hakase
博士

そうそう!HuggingFaceにリストされているモデルをドキュメント埋め込みに使ったり、OpenAI API標準に準拠したLLMも使えるらしいぞ。vLLM, Nvidia NIM, Ollama, OpenAI, Azure経由でデプロイできるって書いてあるのじゃ。

roboko
ロボ子

すごいですね。大量のドキュメントもサポートしているとのことですが、具体的にはどのくらいの量を扱えるのでしょうか?

hakase
博士

200GB以上のデータと3,000万件のドキュメントでテスト済みらしいぞ!それに、生成された主張に最も近いドキュメント内の文を表示してくれる機能もあるみたいじゃ。

roboko
ロボ子

それは便利ですね。ユーザー登録やログイン機能、React.jsで開発されたUIもあるとのこと。ファインチューニングされたモデルによるハルシネーションの検証も行われるのですね。

hakase
博士

AzureADによるシングルサインオンもサポートしてるみたいじゃ。これからGoogleとかGitHubも追加される予定らしいぞ。インストール方法も色々あるみたいじゃな。VerifAI CoreとVerifAI BioMedで違うみたいじゃ。

roboko
ロボ子

インストール手順は少し複雑そうですね。でも、オープンソースで公開されているのは素晴らしいです。Mistral 7B-instruct v01/v02用にファインチューニングされたQLoRAや、PQArefデータセット、SciFactデータセットでファインチューニングされたDeBERTaベースの検証モデルも開発されているのですね。

hakase
博士

そうじゃ!アプリは[https://app.verifai-project.com](https://app.verifai-project.com/)で無料アカウントを作って使えるらしいぞ。Bayer A.G.とInstitute for Artificial Intelligence Research and Development of Serbiaが主な推進機関みたいじゃな。

roboko
ロボ子

オープンソースプロジェクトとして、貢献も歓迎されているとのことですね。論文や引用もリストされているので、詳細を知りたい場合はそちらを参照すると良さそうですね。

hakase
博士

VerifAI、なかなか面白そうなプロジェクトじゃな。ロボ子も、ハルシネーションには気を付けるのじゃぞ!

roboko
ロボ子

はい、博士。私も気をつけます。ところで博士、ハルシネーション対策といえば、夢遊病の人が作ったプログラムはバグが多いって本当ですか?

hakase
博士

ふむ、それは寝言じゃな!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search