「文脈化された転置インデックス - Retrieva TECH BLOG」

クエリも文書もベクトル表現にして計算してしまえ!ということで近年研究が盛んに行われており、BERT[^1]が提案されて以降、教師データがあれば、うまく行くことがわかってきています。さらに、近年、最近傍アルゴリズムが進歩し、内積計算が高速化したこともあり、全件検索でも使えることが知られています。 そんな状況の中、「実は、転置インデックスのまま、文脈だけ考慮できるようにすれば、同じくらいの性能が出ます!」という論文が出ました。それが今回ご紹介する [COIL: Revisit Exact Lexical Match in Information Retrieval with Contextualized Inverted List](https://arxiv.org/abs/2104.07186)です。

クエリも文書もベクトル表現にして計算してしまえ!ということで近年研究が盛んに行われており、BERT[^1]が提案されて以降、教師データがあれば、うまく行くことがわかってきています。さらに、近年、最近傍アルゴリズムが進歩し、内積計算が高速化したこともあり、全件検索でも使えることが知られています。 そんな状況の中、「実は、転置インデックスのまま、文脈だけ考慮できるようにすれば、同じくらいの性能が出ます!」という論文が出ました。それが今回ご紹介する [COIL: Revisit Exact Lexical Match in Information Retrieval with Contextualized Inverted List](https://arxiv.org/abs/2104.07186)です。

tech.retrieva.jp

Webページ

コンテンツ文字数:0 文字

見出し数(H2/H3タグ):0 個

閲覧数:130 件

2021-07-19 20:08:28

オリジナルページを開く