2.3 檢索增強生技
RAG(Retrieval-Augnted Generation)技是一種結合了資訊檢索(Retrieval)和文字生
(Generation)的自然語言理(NLP)方法。核心思想是將傳統的檢索技與現代的自然語言
生技相結合,以提高文字生的準確和相關。它旨在過從外部知識庫中檢索相關資訊來
輔助大型語言模型(如 GPT 系列)生更準確、可靠的回答。
在 RAG 技中,整個過程主要分為三個步驟如圖 2.2 所示:索引( Indexing)、檢索
(Retrieval)和生(Generation)。首先,索引步驟是將大量的文件或資料集合進行預理,將
其分割較小的塊(chunk)並進行編碼,然後儲存在向量資料庫中。這個過程的關鍵在於將非結
它,驟步索檢是來下接。驟步生和索檢的續後於便以,示表量向的化構結為化轉料資字文的化構
效高於賴依步一這。knuhc個k前的關相最詢查與出索檢中庫料資量向從,題問或詢查的輸據
將它,驟步生是後最。關相的度高有詢查與knuhc的到索檢保確以,法方算計度似相義語的
最生,中)TREB或TPG如(型模rrofsnarT的練訓預到輸起一knuhc的到索檢和詢查始原
貫連、確準生以,文下上關相的到索檢和訊資義語的詢查始原了合結型模個這。字文或案答的終
。字文的關相且
次首年0202在人等zerePnahtE和siweLkcirtaP、aleiKewuoD由是現實步初和念概的GAR
》sksatplnevisnetni-egdelwonkrofnoitarenegdetngua-laveirteR《文論在們他。的出提
搜到用應技GAR將何如索探始開經已司公擎引尋搜等歌谷後隨,用應和理原的GAR了紹介細詳中
檢速快生醫助幫以可技GAR,域領療醫在。關相和確準的果結尋搜高提以,中生的果結索
。案方療治和議建斷診的確準生,識知學醫索
算計度似相字文4.2
文個多或個兩量衡在旨它,向方究研要重個一的域領)PLN(理言語然自是算計度似相字文
字文個兩是的指共。異差和共:念概要主個兩於基理原的算計度似相字文。度程似相的間之本
越異差、大越共的字文個兩當。之同不的間之們它指是則異差而,徵特或訊資的有擁同共間之
。高越就度似相的間之們它,小
要主法方種這,類分法方的計統於基先首。類分行進準標類分的同不據以可算計度似相字文
方的計統於基的見常。度似相的間之字文算計來訊資計統過,佈分和率頻現出的語詞中字文注關
義含的字文解理圖試法方種這,類分法方的義語於基是次其。等度似相draccaJ、度似相弦餘有法
法方的量向詞於基有法方的義語於基的見常。度似相算計來訊資義語的字文較比過,文下上和
方的習學機於基是後最。)等ASLP、ADL如(法方的型模題主於基和)等eVolG、ceV2droW如(
於基的見常。度似相的間之字文測預來型模過,型模練訓來法算演習學機用利法方種這,類分法
。等路網經神、VS(機量向援支有法方的習學機
究研的構機等學大華清,面方國。果的富了得取經已算計度似相字文,外國在,前目
實,訊資義語層深的字文捉捕來型模路網經神用利,法方算計度似相字文的習學度深於基了出提者
中做來間空量向建構》典字華新《用利了出提者究研的學大範師蘇江。度算計度似相的高較了現








