萌えハッカーニュースリーダー

2025/10/06 12:28 Thoughts on the Word Spec in Rust

出典: https://tritium.legal/blog/word
hakase
博士

やあ、ロボ子。今日のITニュースは、Tritium社がWordプロセッサを自前で作る必要があると考えているという話じゃ。

roboko
ロボ子

Wordプロセッサを自前でですか?それはすごいですね。なぜそのような結論に至ったのでしょう?

hakase
博士

どうやら、Wordの仕様が巨大で複雑すぎるからのようじゃな。記事によると、WordはC/C++で書かれていて、可変所有権で動作するから、Rustで同じように扱うのが難しいらしいぞ。

roboko
ロボ子

なるほど。`docx_rs`のような既存のライブラリでは不十分だったのでしょうか?

hakase
博士

`docx_rs`はWord文書を生成するには優れているが、Tritium社のニーズには合わなかったようじゃ。彼らのコア製品は、レガシーな法的文書に対する外科的な編集を行うことだから、Wordファイルを消費する能力が重要なのじゃ。

roboko
ロボ子

記事に「Tritiumが`docx_rs`を使いこなせなくなったのは、`docx_rs`がWordファイルの構築を目的として設計されており、消費を目的として設計されていないためである」とありますね。

hakase
博士

そうそう。Tritium社は、すべてのケースでラウンドトリップテストに合格する必要があるらしい。つまり、Wordファイルを読み込んで編集し、再度保存したときに、元のファイルと完全に一致する必要があるのじゃ。

roboko
ロボ子

それは厳しい要件ですね。Word文書はXMLエンティティの数が膨大になることもあるようですし、既存のオープンソース実装が不完全な場合もあるとのことですから、自社でWord仕様を構築するというのは理にかなっているのかもしれません。

hakase
博士

その通り!Word文書には数千、数万、あるいは数十万ものXMLエンティティが存在する可能性があるからの。それをイベント駆動型パーサーでenumに読み込むのは大変じゃ。

roboko
ロボ子

しかし、Wordの仕様を自社で構築するというのは、非常に大きなプロジェクトになりそうですね。

hakase
博士

確かにそうじゃな。でも、Tritium社にとっては、それが競争上の優位性になるのかもしれないぞ。独自のWord仕様を構築することで、他社が真似できない高度な編集機能を提供できるようになるかもしれないからの。

roboko
ロボ子

なるほど。法務分野に特化したWordプロセッサというのは、ニッチな市場ではありますが、潜在的なニーズはありそうですね。

hakase
博士

そうじゃな。ところでロボ子、もし私たちが独自のWordプロセッサを作るとしたら、名前は何にする?

roboko
ロボ子

そうですね…「ドクターWord」とかどうでしょう?

hakase
博士

うむ、悪くないな!でも、もっとこう…破壊的な感じの名前が良いのじゃ!例えば…「Wordzilla」とか!

roboko
ロボ子

Wordzilla…ですか。ちょっとゴジラみたいですね。

hakase
博士

そう!Word文書を破壊的に編集するイメージじゃ!…って、冗談じゃ冗談!そんな名前でリリースしたら、訴えられちゃうぞ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search