新版語義搜尋的技術原理

周淵_博士班_學生_2015_李 · 2026年03月03日14:10

新版的語義搜尋，速度快了很多，回答也更豐富了！感謝團隊默默耕耘！

不知這一版在RAG、重排、生成上，是不是做了大幅更新呢。

ray · 2026年03月05日01:15

這個功能我只參與了部分，以下就我所知回答。

這次更新主要著重在「速度」上的改善，基本的 RAG 架構沒什麼改變。
舊版在使用者送出「查詢字串」後，
要等 AI 全部做完才能看到結果，整體感覺就很慢。

新版將流程分成幾個階段，儘早讓使用者看到部分結果，在「感覺」上就會快很多。
流程如下：

一、Retrieve

將使用者輸入的「查詢字串」轉為 embedding。
查「向量資料庫」取得前20筆佛典文字區塊。
將這20筆交由 DILA 自建的 AI (gemma-3-27b) 做相關度評分。舊版是呼叫 OpenAI API 做評分，新版呼叫 Local 的 LLM，速度也有改善。
每做完一筆評分，就顯示一筆，所以使用者很快就可以看到第一筆出現。
舊版會一次產生20筆的「相關度說明」，新版則是在使用者按了「AI 說明」才會產生單筆「相關度說明」，就不會影響整體速度。

二、Generate

以上說明，敬請指教。

周淵_博士班_學生_2015_李 · 2026年03月05日03:04

原来如此，这个方式很精巧啊。做完什么马上呈现什么，用户也不会等太久。非常感谢！